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内 容 近 要 


本 书 以 问答 的 形式 组 织 内 容 ， 讨 论 了 学 习 或 使 用 C 语 言 的 过 程 中 经 常 遇 到 的 
一 些 问题 。 书 中 列 出 了 C 用 户 经 常 问 的 400 多 个 经 典 问 题 ， 涵 盖 了 初始 化 、 数 组 、 
间 针 、 字 符 串 、 内 存 分 配 、 库 函数 、C 预 处 理 器 等 各 个 方面 的 主题 ， 并 分 别 给 出 
了 解答 ， 而 且 结合 代码 示例 阐明 要 点 。 

本 书 结 构 清 晰 ， 讲 解 透彻 ， 是 各 高 校 相 关 专 业 C 语 言 课 程 很 好 的 教学 参考 
书 ， 也 是 各 层次 C 程 序 员 的 优秀 实践 指南 。 
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1979 年 的 某 段 时 间 ， 我 听 到 很 多 人 在 谈论 C 这 个 当时 还 挺 新 的 语言 和 那 本 刚 
刚 推出 的 书 。 我 买 了 一 本 Brian Kernighan 和 Denis Ritchie 写 的 The C Programming 
Language《〈 也 称 K&R) ， 但 它 在 我 的 书架 上 空 等 了 好 一 阵子 ， 因 为 当时 我 并 不 急 
着 需要 它 〈( 况 且 我 那 时 候 还 是 一 个 余 暇 无 多 的 大 一 新 生 )〉 。 后 来 证 明 这 本 书 买 得 
很 幸运 ， 因 为 当 我 最 后 拿 起 它 以 后 ， 就 再 也 没有 放下 了 : 从 那 以 后 ， 我 就 一 直 在 
用 C 语 言 编程 。 

1983 年 我 结识 了 新 闻 组 net.lang.c， 这 【以 及 它 的 后 继 者 comp.lang.c)〉 是 一 个 
绝 佳 的 地 方 ， 你 可 以 学 习 C 语 言 的 方方面面 ， 发 现 别人 关于 C 语 言 的 各 种 疑问 ， 认 
识 到 你 可 能 根本 还 没有 掌握 关于 C 语 言 的 一 切 。C 语 言 尽 管 表面 上 很 简单 ， 但 也 还 
有 一 些 并 不 显而易见 的 方面 ， 有 些 问题 不 断 有 人 问 起 。 本 书 根据 我 从 1990 年 5 月 
开始 在 comp.lang.c 上 发 布 的 常见 问题 FAQ) 列表 收集 了 这 样 的 一 些 问题 ， 并 提 
供 了 答案 。 

然而 我 得 声明 ， 这 本 书 并 不 是 对 C 语 言 的 批评 或 诽谤 。 用 户 在 使 用 时 遇 到 困 
难 ， 很 容易 迁怒 于 语言 (或 其 他 任何 工具 ) 或 者 要 求 正 确 设计 的 工具 “应 该 ?防止 
用 户 的 误 用 。 因 此 看 到 书 中 提 及 的 各 种 误 用 以 后 ， 很 容易 将 这 样 的 书 看 作 试图 显 
示 C 语 言 的 先天 不 足 的 长 篇 控诉 。 这 实在 是 远 悖 我 的 本 意 。 

如 果 我 不 认为 C 语 言 是 一 门 伟大 的 语言 ， 或 者 没有 在 这 种 语言 的 编程 中 获得 
那么 多 的 乐趣 ， 那 我 永远 也 学 不 到 足够 的 关于 C 语 言 的 知识 来 写 出 本 书 ， 而 且 也 
不 会 试图 写 出 本 书 来 让 别人 更 爱 用 C 语 言 。 我 很 喜欢 C 语 言 ， 我 教 C 的 课 并 花 时 间 
参与 网 上 讨论 的 原因 之 一 ， 就 是 希望 发 现 这 门 语言 (或 者 说 编程 本 映 ) 在 哪些 方 
面 比较 难 学 ， 让 人 不 易 高 效 地 编程 。 本 书展 示 了 我 认识 到 的 部 分 内 容 ， 这 些 问 题 
宣 无 疑问 就 是 人 们 遇 到 麻烦 最 多 的 ， 而 答案 则 经 过 多 年 的 反复 修正 ， 就 是 为 了 消 
除 人 们 的 麻烦 。 

如 果 这 些 答 案 中 有 任何 错误 ， 那 么 读者 一 定 会 遇 到 有 麻烦。 尽管 审 稿 人 和 我 都 


尽力 去 除 所 有 的 错误 ， 但 从 一 部 手稿 中 根除 最 后 一 个 错误 ， 就 跟从 程序 中 去 掉 最 
后 一 个 bug 一 样 困难 。 通 过 出 版 社 转 交 或 发 往 我 的 E-mail 地 址 的 任何 修正 和 建议 我 
都 感激 不 尽 。 同 时 我 也 对 任何 错误 的 第 一 个 发 现 者 按 惯例 提供 $1.00 的 报酬 。 如 果 
你 能 够 访问 因特网 ， 你 可 以 在 问题 20.47 提 到 的 ftp 和 http 网 址 中 找到 一 份 勘 误 表 
《和 错误 发 现 者 的 积分 表 〉。 

希望 我 已 经 湾 清 ， 这 本 书 并 不 是 对 C 语 言 的 批评 ， 也 不 是 对 我 学 习 过 的 C 语 言 
的 书 或 其 作者 的 批评 。 从 K&R 中 我 不 仅 学 到 了 C 语 言 ， 还 学 会 了 编程 。 在 试图 用 
自己 的 页 献 来 丰富 C 语 言 的 文献 的 时 候 ， 我 唯一 遗憾 的 就 是 本 书 没有 做 到 K&R 第 
二 版 发 现 的 妙 处 ， 即 “C 不 是 一 门 复杂 的 语言 ， 并 不 值得 为 它 写 本 厚 书 ”。 我 希望 
那些 深 深 地 欣赏 C 语 言及 K&R) 的 简洁 和 精确 的 人 ， 看 到 本 书 反 反复 复 讲述 某 
些 东 西 ， 或 用 3 种 稍稍 不 同 的 方式 讲述 一 个 问题 的 时 候 不 要 生气 。 

尽管 封面 上 只 印 着 我 一 个 人 的 名 字 ， 但 这 本 书 的 背后 却 有 许 许 多 多 的 人 ， 简 
直 不 知道 该 从 哪里 开始 感谢 。 从 某 种 意义 上 讲 ，comp.lang.c 的 每 个 读者 (现在 约 
有 320 000 人 ) 都 做 出 了 贡献 : 这 本 书 背 后 的 FAQ 列 表 是 为 comp.lang.c 写 的 ， 因 而 
本 书 也 保留 了 comp.lang.c 良 好 的 讨论 氛围 。 

我 希望 这 本 书 也 保留 了 我 开始 阅读 netlang.c 时 所 学 习 的 正确 C 语 言 编程 的 思 
想 。 因 此 ， 我 要 首先 感谢 我 所 知 的 一 贯 清楚 解释 这 种 思想 的 人 : Doug Gwyn, 
Guy Harris. Karl Heuer, Henry Spencer 和 Chris Torek。 这 些 绅士 们 多 年 来 不 断 耐 
心 、 慷 慨 而 睿智 地 解答 各 种 无 穷尽 的 问题 。 是 我 出 头 写 下 这 些 利 见 问题 的 ， 但 不 
要 以 为 是 我 给 出 了 这 些 答案 。 我 曾经 是 个 学 生 〈 我 想 正 是 Guy 解 答 了 我 提出 的 问 
题 ， 现 为 本 书 问题 5.10) ， 我 对 走 在 前 面 的 大 师 们 感激 不 尽 。 这 本 书 与 其 说 是 我 
的 ， 不 如 说 是 他 们 的 。 但 对 书 中 的 不 足 和 错误 我 愿 一 力 承 担 。 

在 线 FAQ 在 变 成 本 书 的 过 程 中 增长 了 3 倍 ， 它 的 增长 一 度 太 快 也 变 得 有 些 笨 
拙 了 。Mark Brader, Vinit Carpenter. Stephen Clamage、 Jutta Degener、 Doug 
Gwyn, Karl Keuer、Joseph Kent 和 George Leach 阅 读 了 部 分 或 全 部 的 手稿 ， 帮 有 我 对 
这 一 过 程 施加 了 一 些 控制 ， 感 谢 他 们 大 量 的 仔细 建议 和 修正 。 他 们 的 努力 都 源 自 
一 个 共同 的 愿望 ， 期 待 在 编程 社区 中 提高 对 C 语 言 的 整体 理解 。 感 谢 他 们 的 页 

这 些 审 稿 人 中 有 3 个 长 期 以 来 也 是 在 线 FAQ 的 贡献 者 。 感 谢 Jutta Degeneri 
Karl Heuer 多 年 来 的 帮助 ， 尤 其 感谢 Mark Brader， 从 5 年 前 我 第 一 次 在 comp.lang.c 


上 发 布 FAQ 以 来 ， 他 就 一 直 给 予 我 批评 。 我 不 知道 他 哪里 来 的 妆 力 提出 那么 多 的 
建议 和 修正 ， 其 中 部 分 还 遭 到 了 我 持久 顽固 的 拒绝 ， 即 使 〈 正 如 我 最 后 意识 到 
的 ) 它们 实际 的 确 是 改进 。 你 可 以 感谢 Mark 为 本 书 提 供 的 很 多 解释 的 表述 形式 ， 
而 弄 糟 的 部 分 就 责怪 我 吧 。 

还 要 感谢 : Susan Cyr 设 计 的 封面 ，Bob Dinse 和 Eskimo North 提 供 的 网 络 环 
境 ， 这 对 这 样 的 项 目 至 关 重 要 ; Bob Holland 提 供 的 计算 机 ， 这 本 书 的 大 部 分 内 容 
都 是 用 它 写成 的 ，Pete “Keleher 提 供 的 Alpha 文 本 编辑 器 ;华盛顿 大 学 数学 研究 和 
工程 图 书馆 提供 的 图 书 查 询 便 利 ; 华盛顿 大 学 海洋 学 系 借 给 我 的 磁带 驱动 器 ， 用 
来 访问 我 尘封 的 新 闻 组 旧 帖 。 

感谢 Tanmoy Bhattacharya 提 供 的 问题 11.11 中 的 例子 ， 感 谢 Arjan Kenter 提 供 的 
问题 13.7 中 的 代码 ， 感 谢 Tomohiko Sakamoto 提 供 的 问题 20.37 中 的 代码 ， 感 谢 
Roger Miller 提 供 的 问题 11.38 中 的 一 行文 字 。 

感谢 世界 各 地 的 人 们 通过 提供 建议 、 修 正 、 建 设 性 的 批评 或 其 他 支持 对 FAQ 
的 贡献 : Jamshid Afshar,Lauri Alanko,Michael B.Allen,David Anderson,Jens 


Andreasen,Tanner Andrews,Sudheer Apte,Joseph Arceneaux,Randall Atkinson,Kaleb 


Axon,Daniel Barker,Rick Beem,Peter Bennett, Mathias Bergqvist, Wayne 
Berke,DanBernstein,Tanmoy Bhattacharya,John Bickers,Kevin Black,Gary 
Blaine, Yuan Bo,Mark J.Bobak, Anthony Borla, Dave Boutcher, Alan 
Bowler,breadbox@muppetlabs.com, Michael Bresnahan, Walter Briscoe, Vincent 
Broman,Robert T.Brown,Stan Brown,John R.Buchan,Joe Buehler,Kimberley 
Burchett,Gordon Burditt,Scott Burkett,Eberhard Burr,Burkhard Burow,Conor 
P.Cahill,D’Arcy J.M.Cain,Christopher Calabrese,Ian Cargill,Vinit Carpenter,Paul 
Carter,Mike Chambers,Billy Chambless,C.Ron Charlton,Franklin Chen,Jonathan 
Chen,Raymond Chen,Richard Cheung,Avinash Chopde,Steve Clamage,Ken 
Corbin,Dann Corbit,lan Cottam,Russ Cox,Jonathan Coxhead,Lee Crawford,Nick 
Cropper,Steve Dahmer,Jim Dalsimer,Andrew Daviel,James Davies,John E.Davis,Ken 
Delong,Norm Diamond,Jamie Dickson,Bob Dinse,dlynes@plenarysoftware,Colin 
Dooley,Jeff Dunlop,Ray Dunn,Stephen M.Dunn,Andrew Dunstan,Michael J.Eager, Scott 
Ehrlich,Amo Eigenwillig,Yoav Eilat,Dave Eisen,Joe English,Bjorn Engsig,David 


Evans, Andreas Fassl,Clive D.W.Feather, Dominic Feeley,Simao Ferraz,Pete Filandr,Bill 


Finke Jr.,Chris Flatters,Rod Flores,Alexander Forst,Steve Fosdick,Jeff Francis,Ken 
Fuchs, Tom Gambill,Dave Gillespie,Samuel Goldstein, Willis Gooch,Tim 
Goodwin,Alasdair Grant,W.Wesley Groleau,Ron Guilmette,Craig Gullixson,Doug 
Gwyn,Michael Hafner,Zhonglin Han,Darrel Hankerson,Tony Hansen,Douglas Wilhelm 
Harder,Flliotte Rusty Harold,Joe Harrington,Guy Harris,John  Hascall,Adrian 
Havill,Richard Heafitheld,Des Herriott,Ger Hobbelt,Sam Hobbs,JoelRay Holveck,Jos 
Horsmeier,Syed Zaeem Hosain,Blair Houghton,Phil Howard,Peter Hryczanek,James 
C.Hu,Chin Huang,Jason Hughes,David Hurt,Einar Indridason,Vladimir Ivanovic,Jon 
Jagger,Ke Jin,Kirk Johnson,David Jones,Larry Jones,Morris M.Keesan,Arjan 
Kenter,Bhaktha Keshavachar,James Kew,Bill Kilgore,Darrell Kindred,Lawrence 
Kirby,Kin-ichi Kitano,Peter Klausler,John Kleinjans,Andrew Koenig, Thomas 
Koenig,Adam Kolawa,Jukka Korpela,Przemyslaw Kowalczyk,Ajoy Krishnan T,Anders 
Kristensen,Jon Krom,Markus Kuhn,Deepak Kulkami,Yohan Kun,B.Kurtz,Kaz 
Kylheku,Oliver Laumann,John Lauro,Felix Lee,Mike Lee,Timothy J.Lee,Tony 
Lee,Marty Leisner,Eric Lemings,Dave Lewis,Don  Libes,Brian Liedtke,Philip 
Lijnzaad,James D.Lin,Keith Lindsay, Yen-Wei Liu,Paul Long, Patrick 
J.LoPresti,Christopher Lott, Tim Love,Paul Lutus,Mike McCarty, Tim 
McDaniel,Michael MacFaden,Allen Mcintosh,J.Scott McKellar,Kevin McMahon, Stuart 
MacMartin,John R.MacMillan,Robert S.Maier,Andrew Main,Bob Makowski,Evan 
Manning,Barry Margolin,George Marsaglia,George Matas,Brad Mears,Wayne Mery,De 
Mickey,Rich Miller,Roger Miller,Bill Mitchell,Mark Moraes,Darren Morby,Bernhard 
Muenzer,David Murphy,Walter Murray,Ralf Muschall,Ken Nakata,Todd Nathan,Taed 
Nelson,Pedro Zorzenon Neto,Daniel Nielsen,Landon Curt Noll,Tim Norman,Paul 
Nulsen,David O’Brien,Richard A.O’Keefe,Adam Kolawa,Keith Edward O’hara,James 
Ojaste,Max Okumoto,Hans Olsson,Thomas Otahal,Lloyd Parkes,Bob Peck,Harry 
Pehkonen,Andrew Phillips,Christopher Phillips,Francois Pinard,Nick Pitfield,Wayne 
Pollock,Polver@aol.com,Dan Pop,Don Porges,Claudio Potenza,Lutz Prechelt,Lynn 
Pye,Ed Price,Kevin D.Quitt,Pat Rankin,Arjun Ray,Eric S.Raymond,Christoph 
Regli,Peter © W.Richards,James Robinson,Greg Roelofs,Eric © Roode,Manfred 
Rosenboom,J.M.Rosenstock,Rick Rowe,Michael Rubenstein,Erkki Ruohtula,John 


C.Rush,John Rushford,Kadda Sahnine,Tomohiko Sakamoto,Matthew Saltzman,Rich 
Salz,Chip Salzenberg,Matthew Sams,Paul Sand,David | W.Sanderson,Frank 
Sandy,Christopher Sawtell,Jonas  Schlein,Paul Schlyter,Doug Schmidt,Rene 
Schmit,Russell Schulz,Dean Schulze,Jens Schweikhardt,Chris Sears,Peter 
Seebach,Gisbert W.Selke,Patricia Shanahan,Girija Shanker,Clinton Sheppard,Aaron 
Sherman,Raymond Shwake,Nathan Sidwell,Thomas Siegel,Peter da Silva,Andrew 
Simmons,Joshua Simons,Ross Smith,Thad Smith,Henri Socha,Leslie J.Somos,Eric 
Sosman,Henry Spencer,David Spuler,Frederic Stark,James Stern,Zalman Stern,Michael 
Sternberg,Geoff Stevens,Alan Stokes,Bob Stout,Dan Stubbs,Tristan Styles,Richard 
Sullivan,Steve Sullivan,Melanie Summit,Erik Talvola,Christopher Taylor,Dave 
Taylor,Clarke Thatcher,Wayne Throop,Chris Torek,Steve Traugott,Brian Trial,Nikos 
Triantafillis, Ilya Tsindlekht, Andrew Tucker,Goran Uddeborg,Rodrigo Vanegas,Jim Van 
Zandt,Momchil Velikov,Wietse Venema,Tom  Verhoeff,Ed Vielmetti,Larry 
Virden,Chris Volpe,Mark Warren,Alan Watson,Kurt Watzka,Larry Weiss,Martin 
Weitzel,Howard West,Tom White,Freek Wiedijk,Stephan Wilms,Tim Wilson,Dik 
T.Winter,Lars Wirzenius,Dave Wolverton,Mitch Wright,Conway Yee,James 
Youngman,Ozan S.Yigit 和 Zhuo Zang。[1l 我 试图 记录 下 我 采纳 建议 的 每 一 个 人 ， 
但 我 担心 可 能 还 是 遗漏 了 一 些 ， 对 那些 名 字 本 该 出 现在 这 里 而 没有 出 现 的 人 ， 我 
WN SH DATE AK o 

最 后 ， 我 要 感谢 Addison-Wesley 的 编辑 Debbie Lafferty， 她 有 一 天 发 邮件 问 我 

售 有 兴趣 写 这 本 书 。 我 有 兴趣 ， 你 现在 手 里 拿 的 就 是 它 。 我 希望 这 本 书 能 让 你 
et EA N 


Steve Summit 
scs@eskimo.com 
1995 年 7 月 于 华盛顿 川西 雅 图 市 


岂 ]. 致 谢 名 单 根据 最 新 资料 整理 。 一 一 编者 注 


你 可 能 在 酒吧 或 聚会 上 有 这 样 的 经 历 ， 有 人 跟 你 打赌 让 你 做 一 些 看 似 简 单 ， 
但 最 后 却 限于 人 体 特 质 或 物理 规律 而 根本 无 法 完成 的 事情 。 跟 你 打赌 的 人 知道 ， 
他 挑战 的 人 越 多 ， 他 持续 获胜 的 可 能 性 就 越 大 ， 因 为 这 些 特质 或 规律 虽然 十 分 隐 
临 ， 却 是 相当 稳定 、 可 以 预测 的 。 

同样 ， 如 果 你 让 很 多 人 来 完成 一 个 复杂 任务 ， 如 学 习 C 语 言 ， 他 们 肯定 会 遇 
到 同样 的 困难 ， 提 出 同样 的 问题 。 在 最 初 设计 任务 的 时 候 这 些 困难 和 问题 也 许 不 
能 预见 ， 而 答案 也 恐怕 是 “后 见 之 明 ”， 但 人 们 依然 会 不 断 遇 到 同样 的 困难 ， 也 会 
不 断 提 出 同样 的 问题 。 这 些 困难 和 问题 并 不 表明 任务 就 不 能 完成 ， 只 能 说 明 它 比 
较 困难 ， 从 而 变 得 很 有 趣 。 

蝇 不 奇怪 ， 这 些 问 题 在 因特网 尤其 是 互动 讨论 的 新 闻 组 上 不 断 被 问 起 。 将 这 
些 常见 问题 收集 起 来 的 想法 是 顺理成章 的 ， 顺 着 这 一 想法 形成 了 常见 问题 
(FAQ) 列表 的 传统 。FAQ 列 表 未 必 忌 能 达成 最 初 设想 的 减少 常见 问题 发 生 率 的 
目的 ， 但 如 果 问 题 是 一 贯 的 ， 那 它们 被 经 常 问 到 并 纳入 FAQ 列 表 的 事实 说 明 ， 它 
们 也 许 正 是 你 或 本 书 的 其 他 读者 要 问 的 问题 。 

关于 本 书 

多 数 〈 关 于 C 语 言 或 其 他 任何 主题 的 ) 书 都 是 从 作者 的 角度 写成 的 。 它 们 是 
用 一 种 作者 自己 明白 的 方式 来 讨论 作者 认为 你 应 该 知道 的 主题 。 如 果 那 种 方式 不 
适合 你 〈 在 茶 种 程度 上 ， 也 不 可 能 适合 ， 因 为 作者 预先 已 经 知道 那些 内 容 ， 而 你 
却 全 然 不 知 ) ， 你 很 有 可 能 被 乔 得 满 头 雾 水 。 

而 这 本 书 却 不 一 样 ， 它 由 400 多 个 问题 组 织 而 成 ， 所 有 问题 都 是 人 们 在 学 习 C 
语言 编程 的 过 程 中 提出 的 真实 问题 。 本 书 不 是 针对 作者 认为 重要 的 议题 ， 而 是 针 
对 真正 的 读者 认为 重要 的 议题 ， 讨 论 他们 提出 的 问题 。 如 果 你 在 学 习 或 使 用 C 语 
而 你 遇 到 的 问题 在 别 的 书 里 都 找 不 到 答案 ， 那 么 你 很 有 可 能 会 在 这 里 找到 答 


言 ， 
案 。 


本 书 不 能 保证 解答 你 在 C 语 言 编 程 中 遇 到 的 所 有 问题 ， 因 为 在 编程 实践 中 产 
生 的 很 多 问题 都 跟 你 的 问题 领域 有 关 ， 而 本 书 只 涵盖 了 C 语 言 本 映 。 正 如 它 不 能 
涵盖 每 个 人 试图 用 C 语 言 解决 的 每 个 问题 的 每 个 方面 ， 本 书 也 不 能 涵盖 每 个 人 用 C 
语言 编程 时 用 的 每 个 操作 系统 的 方方面面 或 每 个 人 希望 用 C 语 言 实现 的 每 个 算 
法 。 具 体 的 问题 、 具 体 的 操作 系统 和 通用 的 算法 都 有 专门 的 书 和 其 他 材料 进行 讨 
论 。 不 过 ， 某 些 跟 操作 系统 和 算法 相关 的 问题 十 分 常见 ， 因 此 第 19 章 和 第 20 章 对 
其 中 一 些 问题 提供 了 简单 的 、 介 绍 性 的 答案 ， 但 不 要 期 得 它们 很 完备 。 

本 书 中 的 问题 是 人 们 在 读 完 一 本 C 语 言 入 门 书 或 上 了 一 门 C 语 言 课程 之 后 常常 
会 提 到 的 。 因 此 本 书 不 是 一 点 点 教 你 学 C 语 言 ， 也 不 会 讨论 任何 C 语 言 教材 都 会 讨 
论 的 基础 问题 。 而 且 ， 本 书 的 答案 在 极 大 程度 上 都 应 该 是 绝对 正确 ， 不 会 传播 任 
何 误解 的 。 因 此 有 些 答案 初 看 起 来 显得 有 些 过 于 详细 ， 它 们 要 问 你 提供 完整 的 图 
景 ， 而 不 能 过 于 简化 而 略 去 了 重要 的 细节 。 毕竟， 很 多 这 类 细节 正 是 本 书 的 问 
答 中 提 到 的 诸多 错误 观点 的 根源 。) 在 这 些 详 尽 的 答案 中 ， 必 要 的 地 方 会 有 捷径 
和 简化 处 理 ， 而 在 术语 表 中 你 会 找到 术语 的 精确 定义 ， 帮 你 准确 解释 很 多 问题 。 
当然 ， 这 些 捷径 和 简化 处 理 都 是 安全 的 ， 它 们 不 会 导致 以 后 的 误解 ， 而 如 果 你 需 
要 完整 的 版 本 ， 你 总 是 可 以 找到 更 详尽 的 解释 或 者 查 到 相关 的 参考 文献 。 

正如 我 们 会 在 第 3 章 和 第 11 章 中 看 到 的 那样 ，C 语 言 的 标准 定义 并 没有 规定 每 
个 写成 的 C 程 序 的 行为 。 有 些 程序 陷入 了 各 种 灰色 地 带 : 它们 可 能 在 某 些 系统 上 
能 运行 ， 而 且 严 格 说 来 也 不 非法 ， 但 却 不 能 确保 在 各 处 都 能 运行 。 本 书 介绍 的 是 
可 移植 的 C 编 程 ， 因 此 在 答案 中 建议 ， 只 要 可 能 就 不 用 不 可 移植 的 方法 。 

本 书 所 基于 的 在 线 FAQ 列 表 是 一 种 对 话 的 方式 ， 当 人 们 看 不 懂 的 时 候 ， 就 会 
直言 不 讳 地 提出 来 。 这 样 的 及 时 反馈 非常 有 利于 改善 解答 的 形式 。 尽 管 出 成 书 以 
后 就 不 能 这 么 动态 了 ， 但 这 样 的 对 话 方式 依然 适用 : 欢迎 你 的 意见 、 批 评 和 建 
议 。 如 果 你 能 访问 因特网 ， 可 以 发 送 意 见 到 scs@eskimo.com， 或 者 寄 信 让 出 版 社 
转交 。 本 书 的 堪 误 表 可 以 在 因特网 上 获得 ， 并 在 网 上 进行 维护 ， 具 体 参 见 问题 
20.47 中 的 信息 。 

问题 格式 

本 书 的 内 容 包含 一 系列 的 问题 及 答案 。 很 多 答案 中 还 列举 了 参考 书目 ， 有 些 
还 有 脚注 ， 如 果 你 觉得 它们 太 吹 毛 求 疲 ， 可 以 略 过 。 

等 宽 字 体 用 来 表示 C 语 法 (函数 和 变量 名 、 关 键 字 等 ) ， 也 用 来 表示 一 些 操 


作 系 统 命 令 〈 如 cc 等 ) 。 偶 尔 出 现 的 tty(4) 这 样 的 符号 表示 UNIX Programmer’ s 
Manual 第 4 章 的 “tty” 一 节 。 

代码 示例 

这 是 本 关于 C 语 言 的 书 ， 因 此 必要 处 给 出 了 许多 C 程 序 段 。 这 些 例子 主要 用 来 
清楚 地 展示 。 它 们 不 一 定 总 是 用 最 高 效 的 方式 写成 的 ， 让 它们 更 “ 快 ” 往 往 会 导致 
更 不 清楚 。 《关于 代码 效率 的 信息 参见 问题 20.14。) 它们 通常 都 是 用 现代 的 
ANSI 风 格 的 语法 写成 。 如 果 你 还 在 使 用 “经 典 的 (classic) ”编译 器 ， 参 见 问题 
11.31 关 于 转换 的 提示 。 

作者 和 出 版 社 欢迎 你 在 自己 的 程序 中 使 用 和 修改 这 些 代码 片段 ， 当 然 如 果 你 
能 提 及 作者 ， 我 们 将 十 分 感激 。〔 某 些 片 段 来 自 其 他 来 源 ， 也 采用 同样 的 策略 。 
如 果 你 使 用 这 些 代 码 ， 请 感谢 对 应 的 贡献 者 。) 较 大 的 例子 的 源码 可 以 通过 匿名 
ftp 从 aw.com 的 cseng/authors/summit/cfaq 下 载 (参见 问题 18.12) 。 

为 了 强调 某 些 要 点 ， 我 不 得 不 举 一 些 不 能 那样 做 的 反例 子 。 在 答案 中 ， 这 样 
的 代码 片段 都 用 WRONG*/ 这 样 明确 的 注释 标示 出 来 了 ， 提 示 你 不 要 模仿 。【〔 问 
题 中 的 代码 片段 通常 没有 类 似 的 标示 ， 但 从 问题 本 喘 的 提 法 上 应 该 很 容易 看 出 代 
码 片 段 有 问题 ， 因 为 这 些 问 题 通 常 是 “为 什么 这 样 做 不 行 "。) 

组 织 

如 前 所 述 ， 本 书 的 问题 来 自信 们 在 实际 的 工作 或 学 习 中 提出 的 真实 问题 ， 这 
些 问题 有 时 不 能 很 好 地 归 类 。 很 多 问题 涉及 多 个 主题 :看 似 内 存 分 配 的 问题 实际 
原因 却 是 声明 错误 。 (有 些 问题 在 两 间 中 都 会 出 现 ， 以 便 它们 更 容易 找到 。) 无 
论 如 何 ， 这 不 是 一 本 必须 从 头 读 到 尾 的 书 : 使 用 目录 、 索 引 和 问题 之 间 的 交叉 索 
引 来 找 你 感 兴趣 的 主题 。《〈 如 果 你 有 空闲 时 间 从 头 读 到 尾 ， 可 能 会 遇 到 你 没有 想 
到 过 的 问题 的 答案 。) 

通常 ， 在 开始 写 代码 之 前 要 先 声 明 数 据 结构 ， 因 此 第 1 章 从 声明 和 初始 化 开 
台 谈 起 。C 语 言 的 结构 、 联 合 和 枚 举 类 型 足够 复杂 ， 值 得 为 它们 单独 写 一 章 。 第 2 
章 讨 论 了 它们 的 声明 和 使 用 方法 。 

程序 中 多 数 的 工作 由 表达 式 语句 完成 ， 这 是 第 3 章 的 主题 。 

第 4 章 到 第 7 章 讨 论 了 许多 新 C 程 序 员 最 头疼 的 内 容 : 指针 。 第 4 章 从 总 体 上 讨 
论 指针 ， 第 5 章 专门 讨论 空 指针 这 一 特殊 情况 ， 第 6 草 描 述 了 指针 和 数组 的 关系 ， 
而 第 7 章 则 探究 了 指针 错乱 背后 的 真正 问题 : 底层 的 内 存 分 配 。 


几乎 所 有 的 C 程 序 都 会 操作 字符 和 字符 串 ， 但 这 些 类 型 却 在 语言 的 底层 实 
现 。 程 序 员 通 常 需要 负责 正确 管理 这 些 类 型 ， 第 8 章 收集 了 管理 这 些 类 型 时 出 现 
的 问题 。 类 似 地 ，C 语 言 也 没有 正式 的 布尔 类 型 ， 第 9 章 简 单 讨论 了 C 语 言 的 布尔 
表达 式 以 及 在 需要 的 时 候 ) 实现 用 户 定义 的 布尔 类 型 的 正确 方法 。 

C 语 言 预 处 理 器 (编译 器 的 一 部 分 ， 人 负责 处 理 #include 和 #define 指 令 一 一 实际 
上 负责 所 有 以 # 开 始 的 行 ) 非常 独特 ， 它 几乎 就 是 一 门 独立 的 语言 ， 因 此 也 单独 
有 一 章 : 第 10 章 。 

ANSI ”C 标 准 委 员 会 (X3J11) ， 在 澄清 C 语 言 的 定义 让 它 简 单 易 懂 的 过 程 
中 ， 引 入 了 一 些 新 的 功能 并 做 出 了 一 些 重 要 的 改变 。 与 ANSI 标 准 C 相 关 的 问题 收 
集 在 第 11 章 。 如 果 你 用 过 ANSI 之 前 的 C 语 言 (也 称 “K&R” 或 “经 典 *C) ， 你 会 觉 
得 第 11 章 介绍 的 差别 很 有 用 处 。 另 一 方面 ， 如 果 你 已 经 在 顺利 地 使 用 ANSI C, H 
么 二 者 的 功能 差别 可 能 就 没什么 意思 了 。 无 论 如 何 ， 第 11 章 中 涉及 其 他 主题 (如 
声明 、 预 处 理 器 和 库 函 数 等 ) 的 所 有 问题 也 会 在 其 他 章节 出 现 或 被 交叉 引用 。 

C 语 言 的 定义 相对 简洁 ， 部 分 原因 是 许多 功能 并 不 是 由 语言 本 身 而 是 由 库 函 
数 提供 的 。 其 中 最 重要 的 就 是 “标准 1O” 库 ， 或 称 stdio 函 数 ， 这 在 第 12 章 讨论 。 其 
他 的 库 函 数 在 第 13 章 讨论 。 

第 14 章 和 第 15 章 讨论 了 两 个 更 高 级 的 主题 : 浮 点 数 和 可 变 参 数列 表 。 无 论 使 
用 哪 种 系统 或 哪 种 语言 ， 浮 点 数 运算 都 颇 有 技巧 。 第 14 章 简 述 了 一 些 一 般 的 浮 点 
数 问题 和 一 些 C 语 言 特 有 的 问题 。 函 数 可 以 接受 可 变 参 数 的 可 能 性 虽然 有 人 认为 
没 必要 而 且 和 危险 ， 但 有 时 却 很 方便 而 且 也 是 printf 函 数 的 核心 功能 。 处 理 可 变 参 数 
列表 的 技巧 在 第 15 章 讨论 。 

如 果 你 对 前 面 的 内 容 已 经 比较 熟悉 ， 那 么 第 16 章 的 问题 你 可 能 希望 最 先 看 
到 : 它们 涉及 偶尔 出 现 的 奇怪 问题 和 程序 中 冒 出 的 极 难 跟踪 的 神秘 bug。 

当 有 两 种 以 上 编写 某 个 程序 的 “正确 ”方法 时 《通常 都 有 ) ， 人 们 往往 根据 主 
观 的 标准 进行 选择 ， 这 些 标准 不 止 跟 代 码 正确 编译 和 运行 有 关系 。 第 17 章 讨论 了 
一 些 编程 风格 上 的 问题 。 

你 不 能 孤立 地 创建 C 程 序 : 你 需要 编译 器 ， 可 能 还 需要 一 些 附 加 的 文档 、 源 
码 或 工具 。 第 18 章 讨论 了 一 些 可 获得 的 工具 和 资源 ， 包 括 lint， 一 个 快要 被 遗忘 但 
曾经 是 检查 程序 正确 性 和 可 移植 性 的 不 可 或 缺 的 工具 。 

如 前 所 述 ，C 语 言 没 有 规定 让 一 个 真正 程序 运行 所 需 的 各 个 方面 。 像 “怎样 从 


键盘 直接 读 入 字符 而 不 用 等 回 车 键 " 和 “如 何 得 到 文件 的 大 小 ”这 样 的 问题 十 分 常 
见 ， 但 C 语 言 却 没有 给 定 答案 ， 这 些 操 作 依 赖 底层 的 操作 系统 提供 的 工具 。 第 19 
章 提 出 了 一 些 这 样 的 问题 ， 同 时 提供 了 一 些 在 常用 操作 系统 下 的 答案 。 

最 后 ， 第 20 章 收集 了 一 些 不 能 放 入 其 他 章节 的 杂项 问题 : 位 操作 、 效 率 、 算 
法 、C 语 言 和 其 他 语言 的 关系 ， 以 及 一 些 琐碎 的 问题 。 【第 20 章 的 介绍 对 内 容 有 
更 详尽 的 划分 。) 

最 后 用 两 个 跟 本 书 而 不 是 C 语 言 关 系 更 密切 的 预备 问题 来 结束 这 个 介绍 。 

问 : 既然 因特网 上 有 免费 版 本 可 以 用 ， 我 为 什么 还 要 花 钱 买 这 本 书 呢 ? 

答 : 这 本 书包 含 的 内 容 大 约 是 发 表 在 comp.lang.c 上 的 内 容 的 三 倍 ， 而 且 尽 管 
电子 文档 有 各 种 优势 ， 但 阅读 这 么 大 的 信息 量 用 印刷 的 形式 还 是 更 容易 一 些 。 
《从 网 上 下 载 再 打印 这 么 多 内 容 会 花 很 多 时 间 ， 而 版 面 也 没有 这 么 漂亮 。) 

问 : “FAQ” 如 何 发 音 ? 

答 : 我 的 发 音 是 “eff ay kyoo”， 而 且 我 相信 这 就 是 FAQ 在 “发 明 ” 时 的 最 初 的 发 
音 。 很 多 人 现在 读 作 “fack”， 这 很 容易 令 人 联想 到 单词 “fact*。 对 复数 形式 ， 我 会 
读 作 “eff ay kyooze”， 但 很 多 人 读 作 “fax”。 这 些 发 音 都 没有 什么 严格 的 对 
并 ,，“FAQ” 是 个 新 词 ， 而 流行 的 用 法 会 在 任何 新 词 的 演化 过 程 中 扮演 重要 的 角 
色 。 

(另外 ， 还 有 一 个 类 似 的 疑问 “FAQ” 是 仅仅 表示 某 个 问题 ， 还 是 包括 该 问题 
和 答案 ， 还 是 全 部 问题 和 答案 呢 ? ) 

现在 ， 开 始 真 正 的 问题 之 旅 ! 


BLIE 声明 和 初始 化 


C 语 言 的 声明 语法 本 身 实 际 上 就 是 一 种 小 的 编程 语言 。 一 个 声明 包含 如 下 几 
个 部 分 〈 但 是 并 非 都 必 不 可 少 ) : 存储 类 型 、 基 本 类 型 、 


类 型 、 类 型 限定 词 和 最 终 的 声 
明 符 〈 也 可 能 包含 初始 化 列表 ) 。 每 个 声明 符 不 仅 声明 一 个 新 的 标识 符 ， 同 时 也 
表明 标识 符 是 数组 、 指 针 、 函 数 还 是 其 他 任意 的 复杂 组 合 。 基 本 的 思想 


思想 是 让 声明 
符 模仿 标识 符 的 最 终 用 法 。“【 问 题 1.21 将 会 更 加 详细 地 讨论 这 种 “声明 模仿 使 
用 ”的 关系 ! ) 


其 本 类 型 


证 一 些 程序 员 惊 奇 的 是 ， 尽 管 C 语 言 是 一 种 相当 低级 的 语言 ， 但 它 的 类 型 体 
系 仍 然 略 显 抽象 。 语 言 本 身 并 没有 精确 定义 基本 类 型 的 大 小 和 表示 法 。 


1.1 


问 : 我 该 如 何 决定 使 用 哪 种 整数 类 型 ? 

答 : 如 果 可 能 用 到 很 大 的 数值 (大 于 32 767 或 小 于 -32 767) ， 就 使 用 long 
。 和 否则 ， 如 果 空 间 很 重要 《例如 有 很 大 的 数组 或 很 多 的 结构 ) ， 就 使 用 short 
。 除 此 之 外 ， 就 用 int 型 。 如 果 定 义 明 确 的 溢出 特征 很 重要 而 负 值 无 关 紧要 ， 或 
者 希望 在 操作 二 进 制 位 和 字 节 时 避免 符号 扩展 的 问题 ， 请 使 用 对 应 的 unsigned 类 
型 。《〈 但 是 ， 在 表达 式 中 混用 有 符号 和 无 符号 值 的 时 候 ， 要 特别 注意 。 参 见 问题 
3.21。) 

芯 管 字符 类 型 〈 尤 其 是 unsigned char!) 可 以 当成 “小 ”整数 使 用 ， 但 这 样 做 
有 时 候 很 抹 烦 ， 不 值得 。 编 译 器 需要 生成 额外 的 代码 来 进行 char 型 和 int 型 之 间 的 
转换 (导致 目标 代码 量 增 大 ) ， 而 且 不 可 预知 的 符号 扩展 也 会 带 来 一 堆 麻 烦 。 
(使 用 unsigned char 会 有 所 帮助 。 类 似 的 问题 参见 问题 12.1。 ) 

在 决定 使 用 float 型 还 是 double 型 时 也 有 类 似 的 空间 /时 间 权 衡 。 (很 多 编译 器 
在 表达 式 求 值 的 时 候 仍然 把 所 有 的 float 型 转换 为 double 型 进行 运算 ) 。 但 如 果 一 
个 变量 的 地 址 确定 且 必 须 为 特定 的 类 型 时 ， 以 上 规则 就 不 再 适用 。 

很 多 时 候 ， 人 们 错误 地 认为 C 语 言 类 型 的 大 小 都 有 精确 的 定义 。 事 实 上 ， 能 
够 确保 的 只 有 如 下 几 点 : 

char 类 型 可 以 存放 小 于 等 于 127 的 值 ; 1) 

short int 和 int 可 以 存放 小 于 等 于 32767 的 值 ; 

long int 可 以 保存 小 于 等 于 2147483647 的 值 ; 

char 至 少 有 8 位 ，short int 和 int 至 少 有 16 位 ， 而 long int 则 至 少 有 32 位 。 在 C99 
H, long ， long 至 少 有 64 位 。 【各 类 型 的 有 符号 和 无 符号 版 本 的 大 小 可 以 确保 一 


het be 


致 。) 
根据 ANSI C 的 规定 ， 可 以 在 头 文件 <limitsh> 中 找到 特定 机 器 下 上 述 类 型 的 
最 大 和 最 小 值 ， 具 体 如 下 表 所 示 。 


基本 类 型 BNR (位 ) ”最 小 值 (有 符号 ) BAM (AGS) BAG (无 符号 ) 
char 8 一 127 127 255 
short 16 -32 767 32 767 65 535 
int 16 -32 767 32 767 65 535 
long 32 —2 147 483 647 2 147 483 647 4 294 967 295 


表 中 的 值 是 标准 能 够 确保 的 最 小 值 。 很 多 系统 允许 更 大 的 值 ， 但 可 移植 的 程 
序 不 能 依赖 这 些 值 。 

如 果 因 为 某 种 原因 需要 声明 一 个 有 精确 大 小 的 变量 ， 确 保 像 C99 的 去 
inttypes.h 之 那样 用 某 种 适当 的 typedef 封 装 这 种 选择 。 通 常 ， 需 要 精确 大 小 的 唯一 
的 合理 原因 是 试图 符合 某 种 外 部 强加 的 存储 布局 。 也 可 参见 问题 1.3 和 20.5。 

参考 资料 : [18, Sec. 2.2 p. 34] 

[19, Sec. 2. 2 p. 36, Sec. A4. 2 pp. 195-196, Sec. B11 p. 257] 
[8, Sec. 5. 2. 4. 2. 1, Sec. 6.1.2.5] 
[11, Secs.5.1,5.2 pp. 110-114] 


1.2 


问 : 为 什么 不 精确 定义 标准 类 型 的 大 小 ? 

答 : 尽管 跟 其 他 的 高 级 语言 比 起 来 ，C 语 言 是 相对 低级 的 ， 但 它 还 是 认为 对 
象 的 具体 大 小 应 该 由 具体 的 实现 来 决定 。 (在 C 语 言 中 ， 唯 一 能 够 让 你 以 二 进 制 
位 的 方式 指定 大 小 的 地 方 就 是 结构 中 的 位 域 。 参 见 问题 2.26 和 2.27。) 多 数 程序 
不 需要 精确 控制 这 些 大 小 ， 那 些 试 图 达到 这 一 目的 的 程序 如 果 不 这 样 做 也 许 会 更 

类 型 int 代 表 机 器 的 自然 字 长 。 这 是 多 数 整 型 变量 的 当然 之 选 。 关 于 整 型 的 选 
择 ， 参 见 问 题 1.1。 另 请 参见 问题 12.45 和 20.5。 


1.3 


H: 因为 C 语 言 没有 精确 定义 类 型 的 大 小 ， 所 以 我 一 般 都 用 typedef 定 义 
int16 和 int32。 然 后 根据 实际 的 机 器 环境 把 它们 定义 为 int、short、long 等 类 
型 。 这 样 看 来 ， 所 有 的 问题 都 解决 了 ， 有 是 吗 ? 

答 : 如 果 你 真 的 需要 精确 控制 类 型 大 小 ， 这 的 确 是 正确 的 方法 。 但 还 是 有 几 
点 需要 注意 。 

在 某 些 机 器 上 可 能 没有 严格 的 对 应 关系 。【〔 例 如 ， 有 36 位 的 机 器 。) 

如 果 定 义 int16 和 int32 只 是 为 了 表明 “至 少 ” 这 么 长 ， 则 没有 什么 实际 意义 。 因 
为 int 和 long 类 型 已 经 分 别 被 定义 为 “至 少 16 位 ”和 “至 少 32 位 ”。 

typedef 定 义 对 于 字 节 顺序 问题 不 能 提供 任何 帮助 。《〈 例 如 ， 当 你 需要 交换 数 
据 或 者 满足 外 部 强加 的 存储 布局 时 。) 

你 再 也 不 必 自 己 定 义 这 些 类 型 了 ， 因 为 标准 头 文件 <inttypes.h> 已 经 定义 了 
标准 类 型 名 称 int16_t 和 uint32_t 等 。 

参见 问题 10.16 和 20.5。 


1.4 


E: 新 的 64 位 机 上 的 64 位 类 型 是 什么 样 的 ? 

答 : C99 标 准 定义 了 long ”long 类 型 ， 其 长 度 可 以 保证 至 少 64 位 ， 这 种 类 型 在 
某 些 编译 器 上 实现 已 经 顾 有 时 日 7 了。 其 他 的 编译 器 则 实现 了 类 似 。 _longlong 的 扩 
展 。 另 一 方面 ， 也 可 以 实现 16 位 的 short、32 位 的 int 和 64 位 的 long int。 有 些 编译 器 
下 是 这 样 做 的 。 

参见 问题 18.19。 

参考 资料 : [9,Sec.5.2.4.2.1,Sec.6.1.2.5] 


指针 声明 


多 数 有 关 指 针 的 问题 出 现在 第 4 章 至 第 7 章 ， 但 这 里 的 两 个 问题 和 声明 的 关系 
特别 紧密 。 


问 : 这 样 的 声明 有 什么 问题 ? 
char *p1, p2; 

我 在 使 用 p2 的 时 候 报错 了 。 

答 : 这 样 的 声明 没有 任何 问题 一 一 但 它 可 能 不 是 你 想 要 的 。 指 针 声 明 中 的 * 
写 并 不 是 基本 类 型 的 一 部 分 ， 它 只 是 包含 被 声明 标识 符 的 声明 符 (declarator〉 的 
一 部 分 参见 问题 1.21) 。 也 就 是 说 ， 在 C 语 言 中 ， 声 明 的 语法 和 解释 并 非 

类 型 标识 符 ; 

而 是 

基本 类 型 生成 基本 类 型 的 东西 ; 

其 中 “生成 基本 类 型 的 东西 ”一 一 声明 符 一 一 或 者 是 一 个 简单 标识 符 ， 或 者 是 
如 同 *p、a[10] 或 {0 这样 的 符 写 ， 表 明 被 声明 的 变量 是 指向 基本 类 型 的 指针 、 基 本 
类 型 的 数组 或 者 返回 基本 类 型 的 函数 。( 当然， 更 加 复杂 的 声明 符 也 可 以 这 样 组 
成 ) 。 

在 问题 里 的 声明 中 ， 无 论 空白 的 位 置 暗示 了 什么 ， 基 本 类 型 都 是 char， 而 第 
一 个 声明 符 是 “*p1”。 因 为 声明 符 中 带 有 * 号 ， 所 以 这 表明 p1 是 一 个 指向 char 类 的 
Hat. 而 p2 的 声明 符 中 却 只 有 p2， 因 此 p2 被 声明 成 了 普通 的 char 型 变量 。 这 可 能 
并 非 你 所 希望 。 在 一 行 代码 中 声明 两 个 指针 可 使 用 如 下 方式 : 

char *p1, *p2; 

因为 * 号 是 声明 符 的 一 部 分 ， 所 以 最 好 像 上 面 这 样 使 用 空白 ， 写 成 char* 往 往 
导致 错误 和 困惑 。 

参见 问题 1.13。 


也 可 参考 Bjame Stroustrup 的 意见 


Chttp://www.hymnsandcarolsofchristmas.com/santa/virginia’s question.htm ) o 
1.6 


H: 我 想 声明 一 个 指针 ， 并 为 它 分 配 一 些 空间 ， 但 却 不 行 。 这 样 的 代码 有 什 
么 问题 ? 
char *p; 
*p=mal loc (10) ; 
答 : 这 里 声明 的 指针 是 p 而 不 是 *p。 参 见 问题 4.2。 


声明 风格 


在 使 用 函数 和 变量 之 前 声明 它们 并 不 只 是 为 了 消除 编译 髓 的 警告 ， 它 也 为 编 
程 项 目 注 入 了 有 用 的 秩序 。 当 项 目 中 的 声明 安排 得 井然 有 序 的 时 候 ，《〈 类 型 ) 不 
匹配 和 其 他 的 困难 就 可 以 更 容易 地 避免 ， 同 时 编译 器 也 更 容易 找到 出 现 的 错误 。 


1.7 


问 : 怎样 声明 和 定义 全 局 变量 和 函数 最 好 ? 

答 : 首先 ， 尽 管 一 个 全 局 变量 或 函数 可 以 〈 在 多 个 编译 单元 中 ) 有 多 处 “声明 
(declaration) ”， 但 是 “定义 〈definition) ” 却 最 多 只 能 允许 出 现 一 次 。 对 于 全 局 
变量 ， 定 义 是 真正 分 配 空 间 并 赋 初 值 (如 果 有 ) 的 声明 。 对 于 函数 ， 定 义 是 提供 
函数 体 的 “声明 ”。 

例如 ， 这 些 是 声明 : 


extern int i; 


extern int fQ; 

而 这 些 是 定义 : 

int 1=0; 

int fO 

{ 

return 1; 

} 

《事实 上 ， 在 函数 的 声明 中 ， 关 键 字 extern 是 可 选 的 。 参 见 问题 1.11。 ) 

当 希 望 在 多 个 源 文件 中 共享 变量 或 函数 时 ， 需 要 确保 定义 和 声明 的 一 致 性 。 
最 好 的 安排 是 在 某 个 相关 的 .c 文 件 中 定义 ， 然 后 在 头 .h 《文件 ) 中 进行 外 部 声明 ， 
在 需要 使 用 的 时 候 ， 只 要 包含 对 应 的 头 文 件 即 可 。 定 义 变 量 的 .c 文 件 也 应 该 包含 
该 头 文 件 ， 以 便 编 译 器 检查 定义 和 声明 的 一 致 性 。 

这 条 规则 提供 了 高 度 的 可 移植 性 : 它 和 ANSIISO C 标 准 一 致 ， 同 时 也 兼容 大 


多 数 ANSI 前 的 编译 器 和 连接 器 。 (UNIX 编 译 器 和 连接 器 常常 使 用 允许 多 重 定义 
的 “通用 模式 ”， 只 要 保证 最 多 对 一 处 进行 初始 化 就 可 以 了 。 这 种 方式 被 ANSI Cop 
准 称 为 一 种 “通用 扩展 ”"， 没 有 语 带 双关 的 意思 。 有 几 个 很 老 的 系统 可 能 曾经 要 求 
使 用 显 式 的 初始 化 来 区 别 定 义 和 外 部 声明 。) 

可 以 使 用 预 处 理 技巧 来 使 类 似 

DEFINE (int, i) ; 

的 语句 在 一 个 头 文 件 中 只 出 现 一 次 ， 然 后 根据 某 个 宏 的 设 定 在 需要 的 时 候 转 

化 成 定义 或 声明 。 但 不 清楚 这 样 带 来 的 驴 烦 是 否 值得 ， 因 为 义 量 减少 全 局 变量 的 
数量 往往 是 个 更 好 的 主意 。 
把 全 局 声明 放 到 头 文件 绝对 是 个 好 主意 : 如 果 和 希望 让 编译 器 检查 声明 的 一 至 
性 ， 一 定 要 把 全 局 声明 放 到 头 文件 中 。 特 别 是 ， 永 远 不 要 把 外 部 函数 的 原型 放 
到 .c 文 件 中 。 如 果 函 数 的 定义 发 生 改变 ， 很 容易 态 记 修改 原型 ， 而 错误 的 原型 内 
BGA 6 

参见 问题 1.24、10.6、17.2 和 18.7。 

参考 资料 : [18, Sec. 4.5 pp. 76-77] 

[19, Sec. 4.4 pp. 80-81] 

[8, Sec. 6.1.2.2, Sec. 6. 7, Sec. 6. 7. 2, Sec. G. 5.11] 
[14, Sec. 3. 1. 2. 2] 

[11, Sec. 4.8 pp. 101-104, Sec. 9.2.3 p. 267] 

[22, Sec. 4.2 pp. 54-56] 


1.8 


问 : 如 何在 C 中 实现 不 透明 〈 抽 象 ) 数据 类 型 ? 
答 : 参见 问题 2.4。 


1.9 
问 : 如 何 生成 “ 半 全 局 变量 ”， 就 是 那 种 只 能 被 部 分 源 文 件 中 的 部 分 函数 访 


问 的 变量 ? 
答 : 这 在 C 语 言 中 办 不 到 。 如 果 不 能 或 不 方便 在 一 个 源 文件 中 放下 所 有 的 函 


数 ， 那 么 有 两 种 常用 的 解决 方案 : 

(1) 为 一 个 库 或 相关 函数 的 包 中 的 所 有 函数 和 全 局 变量 增加 一 个 唯一 的 前 缀 ， 
并 警告 包 的 用 户 不 能 定义 和 使 用 除 文档 中 列 出 的 公用 符号 以 外 的 任何 带 有 相同 前 
缀 的 其 他 符号 。《〈 换 言 之 ， 文 档 中 没有 提 及 的 带 有 相同 前 绥 的 全 局 变量 被 约定 
为 “私有 ”。 ) 

(2) 使 用 以 下 划 线 开头 的 名 称 ， 因 为 这 样 的 名 称 普 通 代 码 不 能 使 用 。《 关 于 更 
多 的 信息 及 对 用 户 命 名 空间 和 实现 命名 空间 之 间 的 “无 人 地 带 ” 的 描述 ， 参 见 问题 
1.30. ) 

也 可 以 使 用 一 些 特殊 的 连接 器 参数 来 调整 名 称 的 可 见 性 ， 但 这 已 经 超出 了 C 
语言 的 范围 了 。 


KHI 


我 们 已 经 讨论 了 声明 的 两 个 部 分 ， 基 本 类 型 和 声明 符 。 下 面 的 几 个 问题 将 讨 
论 存储 类 型 ， 它 决定 了 所 声明 对 象 或 函数 的 可 见 性 和 生命 周期 (又 称 “作用 
域 和 “持续 性 ”) 。 


1.10 


H: 同一 个 静态 (static) 函数 或 变量 的 所 有 声明 都 必须 包含 static 存 储 类 
型 吗 ? 

答 : 语言 标准 并 没有 严格 规定 这 一 点 (最 重要 的 是 第 一 个 声明 必须 包含 
static) ， 但 是 规则 却 比 较 复 杂 ， 而 且 对 函数 和 数据 对 象 的 规定 不 太一 致 。〈 这 个 
领域 有 很 多 历史 变化 。) 因此 ， 最 安全 的 做 法 是 让 static 一 致 地 出 现在 所 有 的 定义 
和 声明 中 。 

外 部 链接 : Jutta Degener 的 一 篇 文章 (http:/c-faq.com/decl/static.jd.html) 解 
释 了 静态 变量 和 静态 函数 的 规则 中 的 微妙 区 别 。 

参考 资料 : [8, Sec. 6. 1. 2. 2] 

[14, Sec. 3. 1. 2. 2] 
[11, Sec. 4. 3 p. 75] 


1.11 


问 : extern 在 函数 声明 中 是 什么 意思 ? 

答 : 存储 类 型 extern 只 对 数据 声明 有 意义 。 对 于 函数 声明 ， 它 可 以 用 作 一 种 
格式 上 的 提示 ， 表 明 函 数 的 定义 可 能 在 另 一 个 源 文 件 中 ， 但 在 

extern int f(Q); 

和 

int fQ; 


之 间 并 没有 实质 的 区 别 。 

参考 资料 : [8, Sec. 6.1.2.2,Sec.6.5.1] 
[14, Sec. 3. 1. 2. 2] 
[11, Secs. 4. 3, 4. 3.1 pp. 75-70] 


1.1 


问 : 关键 字 auto 到 底 有 什么 用 途 ? 

答 : BIH, CCAS. “和 它 是 从 C 语 言 的 无 类 型 前 身 B 语 言 中 继承 下 
来 的 。 在 B 语 言 中 ， 没 有 像 int 这 样 的 关键 字 ， 声 明 必 须 包 含 存 储 类 型 。) 参见 问 
题 20.43。 

参考 资料 : [18, Sec. A8. 1 p. 193] 

[8, Sec. 6.1.2.4, Sec. 6.5.1] 
[11, Sec. 4.3 p. 75, Sec. 4.3.1 p. 76] 


类 型 定义 (typedef) 


typedef 关 键 字 尽管 在 语法 上 是 一 种 存储 类 型 ， 但 正如 其 名 称 所 示 ， 它 用 来 定 
义 新 的 类 型 名 称 ， 而 不 是 定义 新 的 变量 或 函数 。 


1.1 


问 : 对 于 用 户 定义 类 型 ，typedef 和 #define 有 什么 区 别 ? 

答 : 一 般 来 说 ， 最 好 使 用 typedef， 部 分 原因 是 它 能 正确 处 理 指针 类 型 。 例 
如 ， 考 虑 这 些 声 明 : 

typedef char *String t; 

#define String d char * 


String t s1, s2; 

String d s3, s4; 

sl1、s2 和 s3 都 被 定义 成 了 char *， 但 s4 却 被 定义 成 了 char 型 。 这 可 能 并 非 原来 
所 希望 的 。 参 见 问 题 1.5。) 

#define 也 有 它 的 优点 ， 因 为 可 以 在 其 中 使 用 检 fdef (参见 问题 10.15〉 。 男 一 
方面 ，typedef 具 有 遵守 作用 域 规则 的 优点 (也 就 是 说 ， 它 可 以 在 一 个 函数 或 块 内 
声明 ) 。 

参见 问题 1.17、2.23、11.12 和 15.11。 

参考 资料 : [18, Sec. 6.9 p.141] 

[19, Sec. 6.7 pp. 146-147] 
[22, Sec. 6.4 pp. 83-84] 


1.1 


问 : 我 似乎 不 能 成 功 定义 一 个 链表 。 我 试 过 
typedef struct { 


char *item; 
NODEPTR next; 
} *NODEPTR; 
但 是 编译 器 报 了 错误 信息 。 难 道 在 0 语 言 中 结构 不 能 包含 指向 自己 的 指针 
吗 ? 
答 : C 语 言 中 的 结构 当然 可 以 包含 指向 自己 的 指针 。[19] 的 6.5 节 的 讨论 和 例 
子 表明 了 这 点 。 
这 里 的 问题 在 于 typedef。typedef 定 义 了 一 个 新 的 类 型 名 称 。 在 更 简单 的 情况 
FN[2]， 可 以 同时 定义 一 个 新 的 结构 类 型 和 typedef 类 型 。 但 在 这 里 不 行 。 不 能 在 定 
义 typedef 类 型 之 前 使 用 它 。 在 上 边 的 代码 片段 中 ， 在 next 域 声明 的 地 方 还 没有 定 
SCNODEPTR. 
要 解决 这 个 问题 ， 首 先 赋予 这 个 结构 一 个 标签 (“struct node”) 。 然 后 ， 声 
明 “hext” 域 为 “struct node *”， 或 者 分 开 typedef 声 明和 结构 定义 ， 或 者 两 者 都 采 
纳 。 以 下 是 一 个 修正 后 的 版 本 : 
typedef struct node { 


char *item; 
struct node *next; 
} *NODEPTR; 
也 可 以 在 声明 结构 之 前 先 用 typedef， 然 后 就 可 以 在 声明 next 域 的 时 候 使 用 类 
型 定义 NODEPTR 了 : 
struct node; 
typedef struct node *NODEPTR; 
struct node { 
char *item; 
NODEPTR next; 
] ; 
这 种 情况 下 ， 你 在 struct node 还 没有 完全 定义 的 情况 下 就 使 用 它 来 声明 一 个 新 
的 typedf， 这 是 允许 的 。 
最 后 ， 这 是 一 个 两 种 建议 都 采纳 的 修改 方法 : 


struct node { 


char *item; 
struct node *next; 
E 
typedef struct node *NODEPTR; 
使 用 哪 种 方式 不 过 是 个 风格 问题 。 参 见 第 17 章 。 
参见 问题 1.15 和 2.1。 
参考 资料 : [18, Sec. 6.5 p. 101] 
[19, Sec. 6.5 p. 139] 
[8, Sec. 6.5.2, Sec. 6. 5. 2. 3] 
[11, Sec. 5.6.1 pp. 132-133] 


1.1 


间 : 如 何 定义 一 对 相互 引用 的 结构 ? 我 试 过 
typedef struct { 
int afield; 
BPTR bpointer; 
} *APTR; 
typedef struct { 
int bfield; 
APTR apointer; 
} *BPTR; 
但 是 编译 器 在 遇 到 第 一 次 使 用 BPTR 的 时 候 ， 它 还 没有 定义 。 
答 : 与 问题 1.14 类 似 ， 这 里 的 问题 不 在 于 结构 或 指针 ， 而 在 于 类 型 定义 。 首 
我 们 定义 两 个 结构 标签 ， 然 后 〈 不 用 typedef) 定义 链接 指针 : 
struct a { 
int afield; 
struct b *bpointer; 
ie 
struct b { 
int bfield; 


struct a *apointer; 
}; 
对 于 结构 a 中 的 域 定 义 struct b *bpointer， 尽 管 编译 器 此 时 尚未 完成 结构 b CE 
在 此 处 还 处 于 “未 完成 ?阶段 ) 的 定义 ， 但 它 仍 然 可 以 接受 。 有 时 候 需 要 在 这 对 定 
义 之 前 加 上 这 样 一 行 : 
struct b; 
IATE A IT PF CUR SES AN VE FA) 同 外 部 作用 域 的 
structb 区 分 开 来 。 
声明 了 两 个 带 结 构 标签 的 结构 之 后 ， 可 以 再 分 别 定义 两 个 类 型 。 
typedef struct a *APTR; 
typedef struct b *BPTR; 
男 外 也 可 以 先 定义 两 个 类 型 ， 然 后 再 使 用 这 些 类 型 来 定义 链接 指针 域 : 
struct a; 
struct b; 
typedef struct a *APTR; 
typedef struct b *BPTR; 
struct a { 
int afield; 
BPTR bpointer ; 


ie 

struct b { 
int bfield; 
APTR apointer; 


}; 

参见 问题 1.14。 

参考 资料 : [19, Sec. 6.5 p. 140] 
[35, Sec. 3. 5. 2. 3] 
[8, Sec. 6.5.2.3] 
[11, Sec. 5.6.1 p. 132] 


—_ 
—_ 
(=p) 


问 : struct {...} x1; 和 typedef struct{...} x2; 这 两 个 声明 有 什么 区 


答 : 参见 问题 2.1。 


—_ 
jp 
N 


问 : “typedef int (*funcptr) () ;” 是 什么 意思 ? 

答 ， 它 定义 了 一 个 类 型 funcptr， 表 示 指 疝 返 回 值 为 int 型 (参数 未 指明 ) 的 函 
数 的 指针 。 它 可 以 用 来 声明 一 个 或 多 个 函数 指针 。 

funcptr fp1, fp2; 

这 个 声明 等 价 于 以 下 这 种 更 见长 而 且 可 能 更 难 理解 的 写法 : 

int (*pf1) O, (*pf2) © ; 

参见 问题 1.21、4.12 和 15.11。 


consti 1a] 


C 语 言 的 声明 还 包括 类 型 限定 词 。 这 是 ANSI C 中 新 提出 来 的 。 关 于 限定 词 的 
问题 收集 在 第 11 章 。 


—_ 
jp 
co 


问 : 我 有 这 样 一 组 声明 : 

typedef char *charp; 

const charp p; 

为 什么 是 p 而 不 是 它 指 向 的 字符 为 const? 
答 : 参见 问题 11.12。 


—_ 
jp 
(© 


问 : 为 什么 不 能 像 下 面 这 样 在 初始 式 和 数组 维度 值 中 使 用 const 值 ? 
const int n=5; 

int aln]; 

答 : 参见 问题 11.9。 


1.20 


: const char *p, char const *p#echar *const p 有 什么 区 别 ? 
: 参见 问题 11.10 和 1.21。 


I is 


复杂 的 声明 


C 语 言 的 声明 可 以 任意 复杂 。 一 旦 你 熟悉 了 解读 它们 的 方法 ， 即 使 最 复杂 的 
声明 也 可 以 看 得 明白 。 不 过 ， 首 先 来 说 ， 那 些 令 人 眼花 红 乱 的 复杂 声明 很 少 是 真 
正 必要 的 。 如 果 你 不 希望 用 *(*(a[N])0)0 这 样 的 神秘 声明 把 你 的 程序 变 得 混乱 不 
堪 ， 你 总 是 可 以 像 问题 1.21 的 选择 (2) 那 样 ， 用 几 个 类 型 定义 清楚 明了 地 完成 。 


1.21 


问 : 怎样 建立 和 理解 非常 复杂 的 声明 ? 例如 定义 一 个 包含 N 个 指向 返回 指向 
字符 的 指针 的 函数 的 指针 的 数组 ? 

答 : 这 个 问题 至 少 有 以 下 3 种 答案 : 

(1)char *(*(*alN])Q)O; 

(2) 用 typedef 逐 步 完 成 声明 : 


typedef char *pc; /* pointer to char */ 

typedef pc fpc(); /* function returning pointer to char 
*/ 

typedef fpc *pfpc; /* pointer to above */ 

typedef pfpc fpfpc() ; /* function returning... */ 

typedef fpfpc *pfpfpc; /* pointer to... */ 

pfpfpc a[N]; /* array of...*/ 


(3) 使 用 cdecl 程 序 ， 它 可 以 在 黄 文 描述 和 C 语 言 源 码 之 间 相 互 翻 译 。 你 只 需要 
提供 用 自然 语言 描述 的 类 型 ，cdeal 就 能 翻译 成 对 应 的 C 语 言 声明 : 
cdecl >declare a as array of pointer to function returning 
pointer to function returning pointer to char 
char *(*(*aL]) ()) 0 
cdecl 也 可 以 用 于 解释 复杂 的 声明 《向 它 提 供 一 个 复杂 的 声明 ， 它 就 会 输出 对 
应 的 英文 解释 ) 。 对 于 强制 类 型 转换 和 在 复杂 的 函数 定义 中 弄 清 参 数 应 该 进入 哪 


一 对 括号 ，cdecl 也 大 有 神 益 。 在 comp.sources.unix 的 第 14 卷 可 以 找到 cdecl 的 各 种 
版 本 《参见 问题 18.20 和 文献 [19]) 《如 同 在 上 述 的 复杂 函数 定义 中 ) 。 参 见 问题 
18.1。 

C 语 言 中 的 声明 令 人 困惑 的 原因 在 于 ， 它 们 由 两 个 部 分 组 成 : 基本 类 型 和 疡 
明 符 ， 后 者 包含 了 被 声明 的 标识 符 〈 即 名 称 〉》。 声 明 符 也 可 以 包含 字符 *、[] 和 
0， 表 明 这 个 名 称 是 基本 类 型 的 指针 、 数 组 以 及 为 返回 类 型 的 函数 或 者 某 种 组 
SBI Plwm, Æ 

char *p; 

中 ， 基 本 类 型 是 char， 标 识 符 是 pc， 声 明 符 是 *pc; 这 表明 *pc 是 一 个 char OX 
也 正 是 “声明 模仿 使 用 ”的 含义 ) 。 

解读 复杂 C 声 明 的 一 种 方法 是 遵循 “从 内 到 外 ”的 阅读 方法 ， 并 谨 记 [0 和“() 比 
* 的 结合 度 更 紧 。 例 如 ， 对 于 声明 

char *(*pfpc ) () ; 

我 们 可 以 看 出 pfpc 是 一 个 函数 〈 从 0 看 出 ) PTR OMA RBA, R 
数 则 返回 char 型 的 指针 〈 从 外 部 的 * 可 以 看 出 ) 。 当 我 们 后 来 使 用 pfpc 的 时 候 * 
(*pfpco)() 〈pfpc 所 指 的 函数 的 返回 值 指向 的 值 ) 是 一 个 char 型 。 

男 一 种 分 析 这 种 复杂 声明 的 方法 是 ， 遵 循 “ 声 明 模 仿 使 用 ”的 原则 逐步 分 解 声 
明 : 

*(*pfpo)0 是 一 个 char 

(*pfpo)() “是 一 个 “指向 char 的 指针 

(*pfpc) 是 一 个 返回 char 型 指针 的 函数 

pfpc 是 一 个 ” 指 癌 返 回 char 型 指针 的 函数 的 指针 

如 果 你 希望 将 复杂 声明 像 这 样 表达 得 更 加 清楚 ， 可 以 用 一 系列 的 typedef 把 上 
面 的 分 析 表 达 出 来 ， 如 前 文 所 述 的 第 2 种 方法 所 示 。 

这 些 例子 中 的 函数 指针 声明 还 没有 包括 函数 的 参数 类 型 信息 。 如 果 参 数 中 又 
有 复杂 类 型 ， 这 时 候 的 声明 就 真 的 有 些 混 乱 了 。 《现代 版 本 的 cdecl 同 样 会 有 所 帮 
助 。) 

参考 资料 : [19, Sec. 5. 12 p.122] 

[35, 3. 5ff (esp. 3.5.4)] 
[8, Sec. 6. 5ff (esp. Sec. 6. 5. 4) ] 


[11, Sec. 4.5 pp. 85-92, Sec. 5.10.1 pp. 149-150] 


22 


问 : 如 何 声明 返回 指向 同类 型 函数 的 指针 的 函数 ?我 在 设计 一 个 状态 机 ， 用 
孙 数 表示 每 种 状态 ， 每 个 函数 都 会 返回 一 个 指向 下 一 个 状态 的 函数 的 指针 。 可 我 
找 不 到 任何 方法 来 声明 这 样 的 函数 感觉 我 需要 一 个 返回 指针 的 函数 ， 返 回 的 
指针 指向 的 又 是 返回 指针 的 函数 ……: ， 如 此 往复 ， 以 至 无 穷 。 

E: 你 不 能 直接 完成 这 个 任务 。 一 种 方法 是 让 函数 返回 一 个 一 般 的 函数 指针 
《参见 问题 4.13) ， 然 后 在 传递 这 个 指针 的 时 候 进 行 适当 的 类 型 转换 : 

typedef int (*funcptr) (); /* generic function pointer */ 


typedef funcptr (*ptrfuncptr) (); /* ptr to fen returning g. f.p. */ 

funcptr start(, stop () ; 

funcptr state1 () , state2(), state3 () ; 

void statemachine () 

ptrfuncptr state=start; 
while(state !=stop) 
state=(ptrfuncptr) (*state) () ; 

} 

funcptr start() { 

} 

return (funcptr) state; 
(i PRA E NM ptrfuncptrba je SHE oP RAMEE. WRI AIK TE 
义 ， 变 量 state 就 必须 声明 为 funcptr(*state)()， 而 调用 的 时 候 就 得 用 (funcptr 0) 
(*state)O 这 样 令 人 困惑 的 类 型 转换 了 。 ) 

另 一 种 方法 〈 由 Paul Eggert. Eugene Ressler, Chris Volpe 和 其 他 一 些 人 提 
出 ) 是 让 每 个 函数 都 返回 一 个 结构 ， 结 构 中 仅 包含 一 个 返回 该 结构 的 函数 的 指 
针 。 

struct functhunk { 

struct functhunk (*func) Q ; 


ie: 
struct functhunk start(), stop () ; 
struct functhunk state (), state2 () , state3() ; 
void statemach ine () 
{ 
struct functhunk state={start} ; 
while(state. func !=stop) 
state=(*state. func ()) ; 
} 
struct functhunk start () 
{ 
struct functhunk ret; 
ret. func=statel1; 
return ret; 
} 
注意 ， 这 些 例子 中 使 用 了 对 函数 指针 较 老 的 显 式 调用 。 参 见 问 题 4.12 和 问题 
1.17. 


数组 大 小 


J 
N 
je) 


问 : 能 否 声 明和 传 入 数组 大 小 一 致 的 局 部 数组 ， 或 者 由 其 他 参数 指定 大 小 的 


答 : 很 遗憾 ， 这 办 不 到 。 参 见 问题 6.15 和 6.19。 


jp 
N 
= 


H: 我 在 一 个 文件 中 定义 了 一 个 extern 数 组 ， 然 后 在 另 一 个 文件 中 使 用 : 

file1.c: file2.c: 

int array[]={1,2,3}; extern int array[] ; 

为 什么 在 file2. c 中 ，sizeof 取 不 到 array 的 大 小 ? 

答 : 未 指定 大 小 的 extern 数 组 是 不 完全 类 型 。 不 能 对 它 使 用 sizeof， 因 为 sizeof 
在 编译 时 发 生 作 用 ， 它 不 能 获得 定义 在 另 一 个 文件 中 的 数组 的 大 小 。 

你 有 3 种 选择 。 

(1) 在 定义 数组 的 文件 中 声明 、 定 义 并 初始 化 (用 sizeof) 一 个 变量 ， 用 来 保 
存 数 组 的 大 小 : 

file1.c: file2.c: 

int array[]={1, 2,3}; extern int array[] ; 

int arraysz=sizeof (array); extern int arraysz; 

参见 问题 6.23。 

(2) 为 数组 大 小 定义 一 个 明白 无 误 的 第 量 ， 以 便 在 定义 和 extern 声 明 中 都 可 以 
一 致 地 使 用 : filel.h: 

#def ine ARRAYSZ 3 

filel.c: file2. c: 

#include "file1.h" #include "file1. h" 


int array[ARRAYSZ] ; extern int arrayLARRAYSZ] ; 

(3) 在 数组 的 最 后 一 个 元 素 放 入 “哨兵 ” 值 〈 通 常 是 0(、-1 或 者 NULL ) ， 这 样 代 
码 不 需要 数组 大 小 也 可 以 确定 数组 的 长 度 : 

file1.c: file2. c: 

int array[]={1,2,3,-1}; extern int array[]; 

很 明显 ， 选 择 在 一 定 程度 上 取决 于 数组 是 否 已 经 被 初始 化 。 如 果 已 经 被 初始 
化 ， 则 选择 (2) 就 不 太 好 了 。 参 见 问题 6.21。 

参考 资料 : [11, Sec. 7. 5.2 p. 195] 


声明 问题 


有 时 候 ， 无 论 你 觉得 已 经 多 么 仔细 地 创建 了 那些 声明 ， 编 译 器 都 还 是 坚持 报 
音 。 这 些 问 题 揭示 了 一 些 原因 。【《 第 16 章 收集 了 一 些 类 似 的 莫名 其 妙 的 运行 时 间 
题 。) 


1.2 


H: 函数 只 定义 了 一 次 ， 调 用 了 一 次 ， 但 编译 器 提示 非法 重 声明 了 。 

答 : 在 作用 域内 没有 声明 就 调用 〈 可 能 是 第 一 次 调用 在 函数 的 定义 之 前 ) 的 
函数 被 认为 声明 为 : 

extern int f(); 

即 未 声明 的 函数 被 认为 返回 int 型 且 接受 个 数 不 定 的 参数 ， 但 是 参数 个 数 必须 
确定 ， 且 其 中 不 能 有 “ 罕 ” 类 型 。 如 果 之 后 函数 的 定义 不 同 ， 则 编译 器 就 会 警告 类 
型 不 符 。 返 回 非 int 型 、 接 受 任何 “ 窜 ” 类 型 参数 或 可 变 参 数 的 函数 都 必须 在 调用 前 
声明 。〔 最 安全 的 方法 就 是 声明 所 有 函数 ， 这 样 就 可 以 用 函数 原型 来 检查 参数 传 
入 是 否 正确 ) 。 

另 一 个 可 能 的 原因 是 该 函数 与 某 个 头 文 件 中 声明 的 另 一 个 函数 同名 。 

参见 问题 11.4 和 15.1。 

参考 资料 : [18, Sec. 4.2 p. 70] 

[19, Sec. 4.2 p. 72] 
[8, Sec. 6. 3. 2. 2] 
[11, Sec. 4.7 p. 101] 


1.2 


问 : main 的 正确 定义 是 什么 ? void main 正 确 吗 ? 


oh 


: 参见 问题 11.17。 (这 样 的 定义 不 正确 。) 


m= 


PF 


: 我 的 编译 器 总 在 报 函 数 原型 不 匹配 的 错误 ， 可 我 觉得 没什么 问题 。 这 是 


: 参见 问题 11.4。 


ps 
N 
co 


: 文件 中 的 第 一 个 声明 就 报 出 奇怪 的 语法 错误 ， 可 我 看 没什么 问题 。 这 是 


: 参见 问题 10.9。 


jp 
N 
(© 


: 为 什么 我 的 编译 器 不 允许 我 定义 大 数组 ， 如 double array[256] [256]? 
: 参见 问题 19.28， 可 能 还 有 问题 7.20。 


命名 空间 


命名 的 问题 似乎 并 非 一 个 问题 ， 可 它 的 确 是 个 问题 。 为 函数 和 变量 命名 不 像 
为 书 、 建 筑 物 或 者 孩子 命名 那么 困难 一 一 你 不 需要 考虑 公众 是 否 会 喜欢 你 程序 中 
的 名 称 一 一 但 你 的 确 需 要 确保 这 些 名 称 尚 未 被 占用 。 


1.30 


E: 如 何 判 断 哪些 标识 符 可 以 使 用 ， 哪 些 被 保留 了 ? 

答 : 命名 空间 的 管理 有 些 麻烦 。 问 题 (可 能 并 不 总 是 那么 清楚 〉 是 你 不 能 使 
用 那些 已 经 被 实现 使 用 过 的 标识 符 ， 这 会 导致 一 堆 “ 重 复 定义 ”错误 ， 或 者 更 坏 的 
情况 下 ， 静 悄悄 地 奉 换 了 实现 的 标识 符 ， 然 后 把 一 切 都 搞 得 一 团 糟 。 同 时 你 可 能 
也 想 确 保 后 续 版 本 不 会 侵占 你 所 保留 的 名 称 [4]。 ( 拿 一 个 已 经 调试 的 、 正 常 工 作 
的 生产 程序 在 新 版 的 编译 器 下 编译 、 连 接 ， 结 果 却 因为 命名 空间 或 其 他 的 问题 导 
致 编译 失败 ， 没 有 什么 比 这 更 令 人 泪 背 了 。) 因此 ，ANSIISO C 标 准 中 包含 了 相 
当 详 尽 的 定义 ， 为 用 户 和 实现 开辟 了 不 同 的 命名 空间 子 集 。 

要 理解 ANSI 的 规则 ， 在 我 们 说 一 个 标识 符 是 否 被 保留 之 前 ， 我 们 必须 理解 标 
识 符 的 3 个 属性 : 作用 域 、 命 名 空间 和 连接 类 型 。 

C 语 言 有 4 种 作用 域 〈 标 识 符 声 明 的 有 效 区 域 ) : 函数 、 文 件 、 块 和 原型 。 
《第 4 种 类 型 仅仅 存在 于 函数 原型 声明 的 参数 列表 中 。 人 参见 问题 11.6。 ) 

C 语 言 有 4 种 命名 空间 : 行 标 〈label， 即 goto 的 目的 地 ) 、 标 签 (tag， 结 构 、 
联合 和 枚 举 的 名 称 。 这 3 种 命名 空间 相互 并 不 独立 ， 即 使 在 理论 上 它们 可 能 独 
立 ) 、 结 构 /联合 成 员 〔 每 个 结构 或 联合 一 个 命名 空间 ) ， 以 及 标准 所 谓 的 其 他 
的 “普通 标识 符 ”( 函 数 、 变 量 、 类 型 定义 名 称 和 枚 举 常量 ) 。 男 一 个 名 称 集 ( 尽 
管 标准 并 没有 称 其 为 “命名 空间 ”) 包括 了 预 处 理 宏 。 这 些 宏 在 编译 器 开始 考虑 上 
述 4 种 命名 空间 之 前 就 会 被 扩展 。 

标准 定义 了 3 种 “连接 类 型 "*， 外 部 连接 、 内 部 连接 和 无 连接 。 对 我 们 来 说 ， 外 
部 连接 就 是 指 全 局 、 非 静态 变量 和 函数 (在 所 有 的 源 文 件 中 有 效 ) ; 内 部 连接 就 


是 指 限于 文件 作用 域内 的 静态 函数 和 变量 ;而 “无 连接 ? 则 是 指 局 部 变量 及 类 型 定 
X (typedef) 名 称 和 枚 举 常量 。 

根据 文献 [35，S$ec.4.1.2.1] ([8，Sec.7.1.3]) 的 规定 ， 对 规则 的 解释 如 下 。 

规则 1: 所 有 以 下 划 线 打头 ， 后 跟 一 个 大 写字 母 或 另 一 个 下 划 线 的 标识 符 永 
远 保留 (所 有 的 作用 域 ， 所 有 的 命名 空间 )〉。 

规则 2: 所 有 以 下 划 线 打头 的 标识 符 作为 文件 作用 域 的 普通 标识 符 ( 函 数 、 
变量 、 类 型 定义 和 枚 举 常 量 ) 保留 [5]。 

规则 3: 被 包含 的 标准 头 文 件 中 的 宏 名 称 的 所 有 用 法 保留 。 

规则 4: 标准 库 中 的 所 有 有 具有 外 部 连接 属性 的 标识 符 《〈 即 函数 名 ) 永远 保留 
用 作 外 部 连接 标识 符 。 

规则 5: 在 标准 头 文件 中 定义 的 类 型 定义 和 标签 名 称 ， 如 果 对 应 的 头 文件 被 
含 ， 则 在 《同一 个 命名 空间 中 的 ) 文件 作用 域内 保留 。 (事实 上 ， 标 准 声 称 “ 所 
有 作用 于 文件 作用 域 的 标识 符 ”， 但 规则 4 没有 包含 的 标识 符 只 剩 下 类 型 定义 和 标 
签名 称 了 。) 

由 于 有 些 宏 名 称 和 标准 库 标识 符 集 被 保留 作 * 未 来 使 用 ”， 这 使 得 规则 3 和 规则 
4 变 得 愈加 复杂 。 后 续 版 本 的 标准 可 能 定义 符合 特定 模式 的 新 名 称 。 下 表 定 义 了 
包含 标准 头 文件 时 ， 保 留 作 “未 来 使 用 ”的 名 称 模式 。 


头 文件 “未 来 使 用 ”的 模式 
<ctype.h> is[a-z]*, tola-z]* (W) 
<errno.h> E[0-9]*, E[A-Z]* (KEM) 
<locale.h> LC[A-Z]*〈《 宏 定义 ) 
<math.h> Cosf、sinf 和 sqrtf 等 


Cosl、sinl 和 sqrt1l 等 (所 有 的 函数 ) 


<signal.h> SIG[A-Z]*、SIG[A-Z]*〔 宏 定义 ) 
<stdlib.h> str[a-z]* (函数 ) 
<string.h> mem[a-z]*. str[a-z]. wes[a-z]* (图 数 ) 


[A-Z] 表 示 “ 任 何 大 写字 母 ”同样 ，[a-z] 和 [0-9] 分 别 表示 小 写字 母 和 数字 。* 
号 表示 “任何 字符 ”。 例 如 ， 如 果 你 包含 了 <stdlib.h> 之 ， 则 所 有 的 以 str 打 头 、 后 跟 
一 个 小 写字 母 的 标识 符 都 被 保留 。 

这 5 条 规则 到 底 是 什么 意思 ? 如 果 你 希望 确保 安全 : 

1、2。 不 要 使 用 任何 以 下 划 线 开始 的 名 称 。 


3。 不 要 使 用 任何 匹配 标准 宏 《〈 包 括 保留 作 “ 未 来 使 用 ”) 名 称 。 

4。 不 要 使 用 任何 标准 库 中 已 经 使 用 或 者 保留 作 “ 未 来 使 用 ”的 函数 和 全 局 变量 
名 称 。 

严格 地 讲 , “匹配 ?是 指 匹配 前 6 个 字符 ， 不 分 大 小 写 。 参 见 问题 11.29。 ) 
不 要 重 定义 标准 库 的 类 型 定义 和 标签 名 称 。 

事实 上 ， 上 面 的 列表 有 些 保 守 。 如 果 你 愿意 ， 也 可 以 记 住 下 面 的 例外 : 

1、2。 你 可 以 使 用 下 划 线 打头 、 后 接 一 个 数字 或 小 写字 母 的 名 称 来 命名 函 
数 、 块 或 者 原型 作用 域内 的 行 标 和 结构 /联合 成 员 。 

3。 如 有 果 你 不 包含 定义 了 标准 宏 的 头 文件 ， 可 以 使 用 匹配 它们 的 宏 名 称 。 

4。 可 以 使 用 标准 库 函 数 名 作为 静态 或 局 部 变量 名 称 。“〈 严 格 地 讲 ， 是 用 作 
内 部 连接 或 无 连接 类 型 的 的 标识 符 。) 

5。 如 果 你 不 包含 声明 标准 类 型 定义 和 标签 的 头 文 件 ， 则 可 以 使 用 这 些 名 
称 。 

然而 ， 在 使 用 上 述 “ 例 外 ”的 时 候 ， 必 须 注 意 有 些 是 非常 危险 的 (尤其 是 例外 3 
和 5， 因 为 你 可 能 在 后 续 版 本 中 意外 地 包含 进 相关 的 头 文 件 。 比 如 ， 通 过 一 系列 
的 嵌 套 包含 ) 。 其 他 的 ， 尤 其 是 1、2， 是 一 个 用 户 命名 空间 和 实现 保留 的 命名 空 
间 之 间 的 “无 人 地 带 ”。 

提供 这 些 例 外 的 原因 之 一 是 允许 各 种 附加 库 的 实现 者 以 某 种 方式 声明 他 们 自 
己 的 内 部 或 者 “隐藏 "标识 符 。 如 果 你 利用 这 些 例外 ， 则 不 会 和 标准 库 发 生 任 何冲 
突 ， 但 可 能 会 和 你 使 用 的 第 三 方 库 发 生 冲 突 。〈 男 一 方面 ， 如 果 你 是 某 个 第 三 方 
附加 库 的 实现 者 ， 那 么 只 要 足够 小 心 ， 就 可 以 使 用 这 些 名 称 。) 

通常 ， 使 用 例外 4 中 的 标准 库 函 数 或 匹配 保留 作 “ 未 来 使 用 ”模式 的 函数 名 称 作 
为 函数 参数 名 称 或 者 局 部 变量 名 称 的 确 是 安全 的 。 例 如 ，“string” 就 是 一 个 常见 而 
且 合 法 的 参数 或 局 部 变量 名 。 

参考 资料 : [35, Sec. 3. 1. 2. 1, Sec. 3. 1. 2. 3, Sec. 4. 1. 2. 1, Sec. 4. 13] 

[8, Sec. 6.1.2.1, Sec. 6.1.2.2, Sec. 6.1.2.3, Sec. 7. 1. 3, Sec. 7. 13 
[11, Sec. 2.5 pp. 2103, Sec. 4. 2. 1, p. 67, Sec. 4. 2. 4 pp. 69- 
70, Sec. 4.2.7 p. 78, Sec. 10.1 p. 284] 


初始 化 


变量 的 声明 当然 也 可 包含 对 变量 的 初始 化 ， 但 是 不 赋 显 式 的 初始 值 的 时 候 ， 
茶 种 特定 的 缺 省 初始 化 也 可 能 会 执行 。 


1.31 


问 : 对 于 没有 显 式 初始 化 的 变量 的 初始 值 可 以 作 怎 样 的 假定 ?如果 一 个 全 局 
变量 初始 值 为 “ 零 ”， 它 可 否 作为 空 指针 或 浮 点 零 ? 

答 : 具有 静态 〈static) 生存 期 的 未 初始 化 变量 (包括 数组 和 结构 ) 即 在 
函数 外 声明 的 变量 和 静态 存储 类 型 的 变量 ) 可 以 确保 初始 值 为 零 ， 就 像 程序 员 键 
入 了 “=0” 或 “={0}” 一 样 。 

因此 ， 这 些 变量 如 果 是 指针 就 会 被 初始 化 为 正确 类 型 的 空 指 针 《〈 人 参见 第 5 
章 ) ， 如 果 是 浮 点 数 则 会 被 初始 化 为 0.0。[6] 

具有 自动 (automatic〉 生存 期 的 变量 〈 即 非 静态 存储 类 型 的 局 部 变量 ) 如 果 
没有 显 式 地 初始 化 ， 则 包含 的 是 垃圾 内 容 。 对 垃圾 内 容 不 能 作 任何 有 用 的 假定 。 

这 些 规则 也 适用 于 数组 和 结构 《〈 称 为 “聚集 ”") 。 对 于 初始 化 来 说 ， 数 组 和 结 
构 都 被 认为 是 “变量 ”。 

用 malloc 和 realloc 动 态 分 配 的 内 存 也 可 能 包含 垃圾 数据 ， 因 此 必须 由 调用 者 正 
确 地 初始 化 。 用 calloc 获 得 的 内 存 为 全 零 ， 但 这 对 指针 和 浮 点 值 不 一 定 有 用 (参见 
问题 7.35 和 第 5 章 ) 。 

参考 资料 : [18, Sec. 4.9 pp. 82-84] 

[19, Sec. 4.9 pp. 85-86] 

[8, Sec. 6.5. 7, Sec. 7. 10. 3. 1, Sec. 7. 10. 5. 3] 

[11, Sec. 4.2.8 pp. 72-73, Sec. 4.6 pp. 92-93, Sec. 4.6.2 pp. 94- 
95, Sec. 4.6.3 p.96, Sec. 16.1 p. 386] 


1,32 


El: 下 面 的 代码 为 什么 不 能 编译 ? 

int fO 

{ 

char a[]="Hello, world!"; 

} 

答 : 可 能 你 使 用 的 是 ANSI 前 的 编译 器 ， 还 不 支持 “自动 聚集 ”(automatic 
aggregate， 即 非 静 态 局 部 数组 、 结 构 和 联合 〉 的 初始 化 。 参 见 问题 11.31。 

有 4 种 办 法 可 以 完成 这 个 任务 : 

(1) 如 果 数 组 不 会 被 写 入 ， 或 者 后 续 的 调用 中 不 需要 更 新 其 中 的 内 容 ， 可 以 把 
它 声明 为 static( 或 者 也 许可 以 声明 成 全 局 变量 〉。 

(2) 如 果 数 组 不 会 被 号 入 ， 也 可 以 用 指针 代替 它 : 


fO 
{ 
char *a="Hello,world!"; 
} 
初始 化 局 部 char * 变 量 ， 使 之 指 疝 字符 串 字 面 量 总 是 可 以 的 (但 请 参考 
1.34) 。 
(3) 如 果 上 边 的 条 件 都 不 满足 ， 你 就 得 在 函数 调用 的 时 候 用 strcpy 手 工 初始 化 
Je 
fO 
{ 
char a[14]; 
strcpy (a, "Hello, world!") ; 
} 


(4) 找 一 个 兼容 ANSI 的 编译 器 。 
参见 问题 11.31。 


1.33 


问 : 下 面 的 初始 化 有 什么 问题 ? 编译 器 提示 “invalid initializers” 或 其 
他 信息 。 


char *p=mal loc (10) ; 
答 : 这 个 声明 是 静态 或 非 局 部 变量 吗 ? 函数 调用 只 能 出 现在 自动 变量 〈 即 局 
部 非 静 态 变量 ) 的 初始 式 中 。 


1.34 


Pl: 以 下 的 初始 化 有 什么 区 别 ? 

char a[]="string literal"; 

char *p="string literal"; 

当 我 向 p[i MAAN, Rate MATT T o 

答 : 字符 串 字 面 量 (string literal) 一 -C 语 言 源 程序 中 用 双 引 号 包含 的 字符 串 
的 正式 名 称 一 有 两 种 稍 有 区 别 的 用 法 : 

(1) 用 作 数 组 初始 值 〈 如 同 在 char a[] 的 声明 中 )〉 ， 它 指明 该 数组 中 字符 的 初始 
值 ; 

(2) 其 他 情况 下 ， 它 会 转化 为 一 个 无 名 的 静态 字符 数组 ， 可 能 会 存储 在 只 读 内 
存 中 ， 这 就 导致 它 不 能 被 修改 。 在 表达 式 环境 中 ， 数 组 通常 被 立即 转化 为 一 个 指 
针 《 参 见 第 6 章 ) 因此 第 二 个 声明 把 p 初 始 化 成 指向 无 名 数组 的 第 一 个 元 素 。 

(为 了 编译 旧 代 码 ) 有 的 编译 器 有 一 个 控制 字符 串 是 否 可 写 的 开关 。 男 外 有 
些 编译 器 则 提供 了 选项 将 字符 串 字 面 量 正式 转换 为 const char 型 的 数组 (以 利于 出 
音 处 理 ) 。 

参见 问题 1.32、6.1、6.2 和 6.8。 

参考 资料 : [19, Sec. 5.5 p. 104] 

[8, Sec. 6. 1. 4, Sec. 6. 5. 7] 
[14, Sec. 3. 1. 4] 
[11, Sec. 2.7.4 pp. 31-32] 


1.35 


=]: char a{[3]}="abc"; 是 否 合 法 ? 
答 : 是 的 。 参 见 问 题 11.24。 


1.3 


H: 我 总 算 弄 清楚 函数 指针 的 声明 方法 了 ， 但 怎样 才能 初始 化 呢 ? 

答 : 用 下 面 这 样 的 代码 : 

extern int func(); 

int (*fp) () =func ; 

当 一 个 函数 名 出 现在 这 样 的 表达 式 中 时 ， 它 就 会 “退化 ?成 一 个 指针 CBU Bask 
地 取出 了 它 的 地 址 ) ， 这 有 点 类 似 数组 名 的 行为 。 

通常 函数 的 显 式 声明 需要 事先 知道 〈 也 许 在 一 个 头 文件 中 ) ， 因 为 此 处 并 没 
有 隐 陈 的 外 部 函数 声明 〈 初 始 式 中 函数 名 并 非 函 数 调用 的 一 部 分 ) 。 

参见 问题 1.25 和 4.12。 


j 
N 


梧 : 能 够 初始 化 联合 吗 ? 
答 : 参见 问题 2.21。 


[了 此 处 是 对 非 负 整数 而 言 。 下 同 。 一 一 译 者 注 


[21. 在 这 个 简单 例子 typedef struct{int i;}simplestruct; 中 ， 结 构 名 和 它 的 typedef 类 型 
名 同时 被 定义 为 “simplestruct*"， 同 时 可 以 看 到 这 里 并 没有 结构 标签 。 


[31. 还 有 ， 存 储 类 型 (static、register 等 ) 也 可 能 和 基本 类 型 一 起 出 现 ， 而 类 型 限 
i] (const、volatile〉 也 可 能 会 点 级 在 基本 类 型 和 声明 符 之 间 。 参 见 问题 11.10。 


[和 .这 里 不 仅 需 要 关注 公用 符号 ， 对 实现 的 内 部 、 私 有 函数 也 得 小 心 。 


[51. 意 即 这 些 标 识 符 被 编译 器 用 作文 件 作用 域内 的 普通 标识 符 了 。 这 些 规则 是 从 C 
语言 的 实现 〈 即 编译 器 ) 的 角度 描述 的 。 下 同 。 一 一 译 者 注 


[6]. 这 意味 着 ， 在 内 部 使 用 非 零 值 表示 空 指针 或 浮 点 0 的 机 吉 的 编译 器 和 连接 器 无 
法 利用 未 初始 化 的 、 以 0 填充 的 内 存 ， 必 须 用 正确 的 值 进 行 显 式 的 初始 化 。 


第 2 草 结构 、 联 合 和 枚 举 


结构 、 联 合 和 枚 举 的 相似 点 是 可 以 定义 新 的 类 型 。 首 先 ， 通 过 声明 结构 和 联 
合 的 成 员 或 域 或 者 构成 枚 举 的 常量 来 定义 新 的 类 型 。 同 时 ， 也 可 能 需要 给 新 类 型 
赋 一 个 标签 (tag) ， 以 便 在 以 后 引用 。 定 义 新 的 类 型 之 后 ， 就 可 以 立即 或 者 稍 后 
《通过 使 用 标签 ) 来 声明 这 个 类 型 的 实例 了 。 

更 麻烦 的 是 ， 也 可 以 使 用 typedef 来 为 用 户 定 义 类 型 定义 新 的 类 型 名 称 ， 如 对 
其 他 任何 类 型 一 样 。 但 是 ， 如 果 这 样 做 ， 必 须 意识 到 类 型 定义 名 称 和 标签 名 〈 如 
果 存 在 的 话 ) 没有 任何 关系 。 

本 章 的 问题 安排 如 下 : 问题 2.1 到 2.19 涵 盖 结 构 ，2.11 到 2.22 涵 盖 联 合 ，2.23 到 
2.25 涵 盖 了 枚 举 ，2.26 和 2.27 则 涵盖 了 位 域 。 


结构 声明 


21 


H: 这 两 个 声明 有 什么 不 同 ? 

struct x1 {...}; 

typedef struct {...} x2; 

答 : 第 一 种 形式 声明 了 一 个 “结构 标签 ”(structure = tag) ; 第 二 种 声明 了 一 
个 “类 型 定义 ”(typedef) 。 主 要 的 区 别 在 于 第 二 种 声明 更 显 抽 象 一 些 一 用 户 不 必 
知道 它 是 一 个 结构 ， 且 在 声明 它 的 实例 时 也 不 需要 使 用 struct 关 键 字 。 

x2 b; 

但 使 用 标签 声明 的 结构 就 必须 用 这 样 的 形式 进行 定义 。[11 

struct x1 a; 

(也 可 以 同时 使 用 两 种 方法 : 

typedef struct x3 {...} x3; 

尽管 有 些 星 深 ， 但 为 标签 和 类 型 定义 使 用 同样 的 名 称 是 合法 的 ， 因 为 它们 处 
于 独立 的 命名 空间 中 。 参 见 问 题 1.30。) 


2.2 


问 : 这 样 的 代码 为 什么 不 对 ? 

struct x {...}; 

x thestruct; 

答 : C 不 是 C++。 不 能 用 结构 标签 自动 生成 类 型 定义 名 。 事 实 上 ，C 语 言 中 的 
结构 是 这 样 用 关键 字 struct 声 明 的 : 

struct x thestruct; 

如 有 果 你 愿意 ， 也 可 以 在 声明 结构 的 时 候 声明 一 个 类 型 定义 ， 然 后 再 用 类 型 定 
义 名 称 去 声明 真正 的 结构 : 


tyepdef struct {...} tx; 
tx thestruct; 
参见 问题 2.1。 


2.3 


司 : 结构 可 以 包含 指向 自己 的 指针 吗 ? 
答 ， 当然 可 以 。 但 如 果 你 要 使 用 typdef， 则 有 可 能 产生 问题 。 参 见 问题 1.14 和 
1.15。 


| 


2.4 


问 : 在 C 语 言 中 用 什么 方法 实现 抽象 数据 类 型 最 好 ? 

B: 让 客户 使 用 指向 没有 公开 定义 《也许 还 隐藏 在 类 型 定义 后 边 ) 的 结构 类 
型 的 指针 是 一 个 好 办 法 。 换 言 之， 客户 使 用 结构 指针 《及 调用 输入 和 返回 结构 指 
针 的 函数 ) 而 不 知道 结构 的 成 员 是 什么 。 只 要 不 需要 结构 的 细节 一 也 就 是 说 ， 
只 要 不 使 用 ->、sizeof、 操 作 符 及 真实 结构 的 声明 一 -C 语 言 事实 上 可 以 正确 处 理 
不 完全 类 型 的 结构 指针 。 只 有 在 实现 抽象 数据 类 型 的 源 文件 中 才 需 要 此 范围 内 的 


结构 的 完整 声明 。 


Pl: 在 C 语言 中 是 否 有 模拟 继承 等 面向 对 象 程序 设计 特性 的 好 方法 ? 

答 : 把 函数 指针 直接 加 入 到 结构 中 就 可 以 实现 简单 的 “方法 "。 你 可 以 使 用 各 
种 不 雅 而 暴力 的 方法 来 实现 继承 ， 例 如 通过 预 处 理 器 或 让 “ 基 类 ”的 结构 作为 初始 
IPS, (LEE ce. WHE, THEA BRETT AN Ba a m P, “YR 
生 类 ”中 的 “方法 ”) ， 那 些 必须 人 工 去 做 。 

显然 ， 如 果 你 需要 “ 真 ” 的 面向 对 象 的 程序 设计 ， 则 需要 使 用 一 个 支持 这 些 特 
性 的 语言 ， 例 如 C++。 


问 : 为 什么 声明 
extern f (struct x *p); 
2 SRT AE xe Te EAE AC “struct x introduced in prototype 


scope” X “struct x declared inside parameter list” ) ? 
答 : 参见 问题 11.6。 


问 : 我 遇 到 这 样 声 明 结 构 的 代码 : 
struct name { 
int namelen; 
char namestr [1]; 
E 
然后 又 使 用 一 些 内 存 分 配 技巧 使 namestr 数 组 用 起 来 好 像 有 多 个 元 素 ， 
namelen 记 录 了 元 素 个 数 。 它 是 怎样 工作 的 ? 这 样 是 合法 的 和 可 移植 的 吗 ? 


答 : 不 清楚 这 样 做 是 否 合 法 或 可 移植 ， 但 这 种 技术 十 分 普通 。 这 种 技术 的 茶 
种 实现 可 能 像 这 个 样子 : 


#include<stdl ib. h> 
#include<string. h> 


struct name *makename (char *newname) 


{ 


struct name *ret= 


malloc (sizeof (struct name) —-1+str len (newname) +1) ; 


/* -1 for initial[1];+1 for NO */ 
if (ret !=NULL) { 


ret->namelen=str len (newname) ; 


strcpy (ret->namestr, newname) ; 


} 
return ret; 


} 
这 个 函数 分 配 了 一 个 name 结 构 的 实例 并 调整 它 的 大 小 ， 以 便 将 请 求 的 名 称 


(不 是 结构 声明 所 示 的 仅仅 一 个 字符 〉 置 入 namestr 域 中 。 
虽然 很 流行 ， 但 这 种 技术 也 在 某 种 程度 上 着 人 非议 。Dennis ” Ritchie 就 称 之 
为 “和 C 实 现 的 无 保证 的 亲密 接触 ?*。 官 方 的 解释 认定 它 没 有 严格 遵守 C 语 言 标准 。 
《关于 这 种 技术 的 合法 性 的 完整 讨论 超出 了 本 书 的 范围 。) 这 种 技术 也 不 能 保证 
在 所 有 的 实现 上 是 可 移植 的 。〔 仔 细 检 查 数 组 边界 的 编译 器 可 能 会 发 出 警告 。) 
男 一 种 可 能 是 把 变 长 的 元 素 声 明成 很 大 ， 而 不 是 很 小 。 上 面 的 例子 可 以 这 样 
改写 : 
#include=stdlib.h> 
#include<string. h> 
#def ine MAX 100 


struct name { 


int namelen; 
char namestr [MAX] ; 
};struct name *makename (char *newname) 
{ 
struct name *ret= 
malloc (sizeof (struct name) —MAX+str len (newname) +1) ; 
/*+1 for \O */ 
if (ret !=NULL) { 
ret—>namelen=str len (newname) ; 
strcpy (ret->namestr, newname) ; 
} 
return ret; 
} 
当然 ， 此 处 的 MAX 应 该 比 任何 可 能 存储 的 名 字 长 度 都 大 。 但 是 ， 这 种 技术 似 
乎 也 不 完全 符合 标准 的 严格 解释 。 
当然 ， 真 正安 全 的 正确 做 法 是 使 用 字符 指针 ， 而 不 是 数组 。 
#include<stdl ib. h> 
#include<string. h> 


struct name { 


int namelen; 
char *namep; 

is 

struct name *makename (char *newname) 

{ 

struct name *ret=mal loc (sizeof (struct name) ) ; 
if (ret !=NULL) { 
ret—>namelen=str len (newname) ; 
ret—>namep=mal loc (ret->namelen+1) ; 
if (ret->namep==NULL) { 
free (ret); 
return NULL; 
} 
strcpy (ret->namep, newname) ; 
} 
return ret; 

} 

显然 ， 把 长 度 和 字符 串 保存 在 同一 块 内 存 中 的 “方便 ”已 经 不 复 存在 了 ， 而 且 
在 释放 这 个 结构 的 实例 的 时 候 需 要 两 次 调用 free。 人 参见 问题 7.27。 

如 果 像 上 面 的 例子 那样 ， 存 储 的 数据 类 型 是 字符 ， 那 么 为 保持 连续 性 ， 可 以 
直截了当 地 将 两 次 malloc 调 用 合成 一 次 〈 这 样 也 可 以 只 用 一 次 调用 free 就 能 释 
放 。) 

struct name *makename (char *newname) 


{ 


char *buf=mal loc (sizeof (struct name) + 
str len (newname) +1) ; 
struct name *ret=(struct name *) buf; 
ret—>namelen=str len (newname) ; 
ret->namep=buftsi zeof (struct name) ; 


strcpy (ret->namep, newname) ; 


return ret; 

} 

但 是 ， 像 这 样 用 一 次 malloc 调 用 将 第 二 个 区 域 接 上 的 技巧 只 有 在 第 二 个 区 域 
是 char 型 数组 的 时 候 才 可 移植 。 对 于 任何 大 一 些 的 类 型 ， 对 齐 “〈 人 参见 问题 2.13 和 
16.8) 变 得 十 分 重要 ， 必 须 保 持 。 

这 些 “ 订 密 ” 结 构 都 必须 小 心 使 用 ， 因 为 只 有 程序 员 知 道 它 的 大 小 ， 而 编译 器 
却 一 无 所 知 。 

C99 引 入 了 “灵活 数组 域 ”概念 ， 允 许 结构 的 最 后 一 个 域 省 略 数 组 大 小 。 这 为 
类 似 问 题 提 供 了 一 个 定义 明确 的 解决 方案 。 

参考 资料 : [14, Sec. 3. 5. 4. 2] 

[9, Sec. 6.5.2.1] 


2.8 


问 : 我 听 说 结构 可 以 赋 给 变量 也 可 以 对 函数 传 入 和 传 出 。 为 什么 K 人 R1 却 明 
确 说 明 不 能 这 样 做 ? 

答 : K&R1l 也 指出 了 在 未 来 版 本 的 编译 器 中 ， 对 于 结构 操作 的 限制 将 会 取 
消 。 实 际 上 ， 就 在 K&R1 出 版 的 时 候 ，Ritchie 的 编译 器 已 经 完全 能 够 支持 结构 赋 
值 、 向 函数 传 入 结构 参数 和 从 函数 返回 结构 。 尺 管 一 些 早 期 的 C 编 译 器 缺乏 这 样 
的 功能 ， 但 所 有 的 现代 编译 器 都 支持 ， 而 且 这 也 成 了 标准 的 一 部 分 了 ， 因 此 ， 没 
有 任何 理由 拒绝 使 用 它们 [2]。 

注意 ， 当 结构 被 赋值 、 传 递 或 返回 的 时 候 ， 复 制 是 作为 一 个 整体 完成 的 。 
这 意味 着 任何 指针 成 员 的 副本 都 和 原 指针 指向 同一 个 地 方 。 换 言 之， 任何 指针 指 
向 的 内 容 都 没有 复制 。) 

现实 的 结构 操作 例子 ， 请 参见 问题 14.11 的 代码 片段 。 

参考 资料 : [18, Sec. 6. 2 p. 121] 

[19, Sec. 6.2 p. 129] 

[35, Sec. 3. 1. 2. 5, Sec. 3. 2. 2. 1, Sec. 3. 3. 15] 
[8, Sec. 6.1.2.5, Sec. 6.2.2.1, Sec. 6. 3. 16] 
[11, Sec. 5.6.2 p. 133] 


2.9 


问 : 为 什么 不 能 用 内 建 的 == 和 1!= 操 作 符 比较 结构 ? 

答 : 没有 一 个 好 的 、 符 合 C 语 言 的 低层 特性 的 方法 让 编译 器 来 实现 结构 比 
较 。 简 单 的 按 字 节 比 较 的 方法 可 能 会 在 遇 到 结构 中 没有 使 用 的 洞 (hole) ”的 随 
机 内 容 的 时 候 失 败 〈 这 些 补 位 是 用 来 保证 后 续 的 成 员 正确 对 齐 的 。 参 见 问题 
2.13) 。 而 按 域 比较 在 处 理 大 结构 时 可 能 需要 难以 接受 的 大 量 重复 代码 。 任 何 编 
译 器 生成 的 比较 代码 都 不 能 期 望 在 所 有 情况 下 都 正确 比较 指针 域 。 例 如 ， 比 较 
char * 域 的 时 候 一 般 都 希望 使 用 stremp 而 不 是 == (参见 问题 8.2) 。 

如 果 需 要 比较 两 个 结构 ， 必 须 自己 写 函 数 按 域 比较 。 

参考 资料 : [19, Sec. 6. 2 p. 129] 

[35, Sec. 4. 11. 4.1 footnote 136] 
[14, Sec. 3. 3. 9] 
[11, Sec. 5.6.2 p.133] 


2.10 


问 : 结构 传递 和 返回 是 如 何 实现 的 ? 

答 : 当 结 构 作 为 函数 参数 传递 的 时 候 ， 通 常会 把 整个 结构 都 推进 栈 ， 需 要 多 
少 空间 就 使 用 多 少 空间 。“ 正 是 为 了 避免 这 个 代价 ， 程 序 员 经 常 使 用 指针 而 不 是 
结构 。) 某 些 编译 器 仅仅 传递 一 个 结构 的 指针 ， 但 是 为 了 保证 按 值 传递 的 语义 ， 
它们 可 能 不 得 不 保留 一 份 局 部 副本 。 

编译 器 通常 会 提供 一 个 额外 的 “隐藏 参数 ， 用 于 指向 函数 返回 的 结构 。 有 些 
老式 的 编译 器 使 用 一 个 特殊 的 静态 位 置 来 返回 结构 。 这 会 导致 返回 结构 的 函数 不 
可 再 入 ， 这 是 ANSI C 所 不 允许 的 。 

参考 资料 : [35, Sec. 2. 2. 3] 

[8, Sec. 5. 2. 3] 


2.11 


问 : 如 何 向 接受 结构 参数 的 函数 传 入 常量 值 ? 怎样 创建 无 名 的 中 间 的 常量 结 


构 值 ? 

答 : 传统 的 C 语 言 没 有 办 法 生成 匿名 结构 值 。 你 必须 使 用 临时 结构 变量 或 一 
个 小 的 结构 生成 函数 。 

C99 标 准 引 入 了 “复合 字面 量 ”(compound literals) ， 复 合 字 面 量 的 一 种 形式 
就 可 以 允许 结构 常量 。 例 如 ， 向 假定 的 plotpoint 函 数 传 入 一 个 坐标 对 常量， 可 以 
调用 

plotpoint((struct point) {1,2}); 

与 “指定 初始 式 ”(designated initializers，C99 的 另 一 个 功能 ) 结合 ， 也 可 以 用 
成 员 名 称 确定 成 员 值 : 

plotpoint((struct point) {. x=1, . y=2}) ; 

参见 问题 4.10。 

参考 资料 : [9, Sec. 6. 3. 2. 5, Sec. 6. 5. 8] 


2.12 


问 : 怎样 从 /向 数据 文件 读 / 写 结构 ? 

答 : 用 fwrite0 编 写 一 个 结构 相对 人 简单: 

fwrite(&somestruct, sizeof somestruct, 1, fp) ; 

对 应 的 fread 调 用 可 以 再 把 它 读 回来 。 此 处 fwrite 收 到 一 个 结构 的 指针 并 把 这 个 
结构 的 内 存 映像 作为 字 节 流 写 入 文件 (或 在 对 应 的 fread 的 时 候 读 入 ) 。sizeof 操 作 
符 计 算出 结构 占用 的 字 节 数 。 

只 要 范围 内 有 fwrite 的 原型 (通常 只 需 包含 <stdio.h 二 ) ， 那 么 ANSI 编 译 器 下 
这 样 调用 fwrite 就 是 正确 的 。 在 ANSI 之 前 的 编译 器 中 ， 需 要 对 第 一 个 参数 进行 类 
型 转换 : 

fwrite((char *) somestruct, sizeof somestruct, 1, fp); 

重要 的 是 fwrite 接 受 字 节 指 针 ， 而 不 是 结构 指针 。 

但 是 这 样 用 内 存 映像 写 出 的 数据 文件 却 不 能 移植 ， 尤 其 是 当 结 构 中 包含 浮 点 
成 员 或 指针 的 时 候 。 结 构 的 内 存 布局 跟 机 器 和 编译 器 都 有 关 。 不 同 的 编译 器 可 能 
使 用 不 同 数量 的 填充 位 ， 不 同 机 器 上 基本 类 型 的 大 小 和 字 节 顺序 也 不 尽 相 同 。 因 
此 ， 作 为 内 存 映 像 写 出 的 结构 在 别 的 机 器 上 《甚至 是 被 别 的 编译 器 编译 后 ) 不 一 
定 能 被 读 回来 。 当 你 需要 在 不 同 的 机 器 上 交换 数据 文件 的 时 候 ， 这 点 尤其 要 注 


意 。 参 见 问题 2.13 和 20.5。 

同时 注意 如 果 结 构 包 含 任何 指针 (char * 字 符 串 或 指向 其 他 数据 结构 的 指 
针 ) ， 则 只 有 指针 值 会 被 写 入 文件 。 当 它们 再 次 被 读 回来 的 时 候 ， 很 可 能 已 经 失 
效 。 最 后 ， 为 了 广泛 的 可 移植 性 ， 你 必须 用 "b" 标 志 打 开 文 件 。 参 见 问 题 12.41。 

移植 性 更 好 的 方案 是 写 一 对 函数 ， 用 可 移植 (可 能 甚至 是 人 可 读 ) 的 方式 按 
域 读 写 结构 ， 尽 管 开始 时 可 能 工作 量 稍 大 。 

参考 资料 : [11, Sec. 15.13 p. 381] 


结构 填充 


N 


.1 


问 : 为 什么 我 的 编译 器 在 结构 中 留 下 了 空洞 ? 这 导致 空间 浪费 而 且 无 法 与 外 
部 数据 文件 进行 “二 进 制 ” 读 写 。 能 否 关 掉 填充 ， 或 者 控制 结构 域 的 对 齐 方式 ? 

答 : 当 内 存 中 的 值 合理 对 齐 时 ， 很 多 机 器 都 能 非常 高 效 地 访问 。 例 如 ， 在 按 
字 节 寻 址 的 机 器 中 ，2 字 节 的 short int 型 变量 必须 放 在 偶 地 址 上 ， 而 4 字 节 的 long int 
型 变量 则 必须 存放 在 4 的 整 倍 数 地 址 上 。 某 些 机 器 甚至 根本 就 不 能 访问 没有 对 章 
的 地 址 ， 因 此 必须 要 求 所 有 的 数据 都 正确 地 对 齐 。 

假如 你 声明 了 这 个 结构 : 


struct { 
char c; 
int i; 
] : 


编译 器 通常 都 会 在 char 型 域 和 int 型 域 之 间 留 出 一 个 没有 命名 也 没有 使 用 的 空 
洞 ， 以 确保 int 型 域 正 确 对 齐 。 【根据 最 保守 的 对 齐 要 求 ， 结 构 本 身 也 是 对 齐 的 ， 
因此 第 二 个 域 可 以 根据 第 一 个 域 的 位 置 进行 累进 对 齐 。 编 译 器 保证 它 所 分 配 的 结 
构 对 齐 ， 对 malloc 也 是 如 此 。) 编译 器 可 能 提供 某 种 扩展 用 于 控制 结构 的 填充 
(可 能 是 却 ragma， 人 参见 问题 11.22) ， 但 是 没有 标准 的 方法 。 

如 果 你 真 的 那么 在 意 被 浪费 的 空间 ， 可 以 把 结构 中 的 域 按 从 从 大 到 小 的 顺序 
排列 ， 以 最 大 限度 地 降低 填充 的 影响 。 数 组 成 员 应 该 根据 它 的 元 素 类 型 大 小 而 不 
是 整个 数组 的 大 小 进行 排序 。 有 了 时候， 使 用 位 域 也 可 以 更 好 地 控制 大 小 和 对 齐 ， 
但 是 这 样 也 有 它 的 缺点 (参见 问题 2.27) 。 

参见 问题 16.8 和 20.5。 

参考 资料 : [19, Sec. 6. 4 p. 138] 

[11, Sec. 5. 6. 4 p. 135] 


N 
j 
= 


P: 为 什么 sizeof 返 回 的 值 大 于 结构 大 小 的 期 望 值 ， 是 不 是 尾部 有 填充 ? 

答 : 为 了 确保 分 配 连续 的 结构 数组 时 正确 对 齐 ， 结 构 可 能 有 这 种 尾部 填充 
(也 可 能 有 内 部 填充 ) 。 即 使 结构 不 是 数组 的 成 员 ， 尾 部 填充 也 会 保持 ， 以 便 
sizeof 能 够 总 是 返回 一 致 的 大 小 。 参 见 问 题 2.13。 

参考 资料 : [11, Sec. 5. 6.7 pp. 139-140] 


N 
j 
gi 


问 : 如 何 确定 域 在 结构 中 的 字 节 偏 移 量 ? 

答 : ANSI C 在 二 stddef.h> 中 定义 了 offsetofO 宏 ， 用 offsetof(structs, 太 可 以 计算 
出 域 f 在 结构 s 中 的 偏 移 量 。 如 果 出 于 某 种 原因 ， 需 要 自己 实现 这 个 功能 ， 可 以 使 
用 下 边 这 样 的 代码 : 

#define offsetof (type, f) ((size_t)\ 

((char *) & ((type *)0)->f - (char *) (type *)0)) 

这 种 实现 不 是 100% 的 可 移植 ， 某 些 编译 器 可 能 会 合法 地 拒绝 接受 。 

(这 复杂 的 定义 需要 一 点 解释 。 对 类 型 转换 后 的 空 指针 的 减法 是 为 了 确保 即 
使 空 指针 的 内 部 表示 不 是 0 的 时 候 也 能 正确 计算 出 偏 移 。 转 换 成 (char *) 指针 可 
以 确保 计算 出 的 偏 移 是 字 节 偏 移 。 不 可 移植 的 地 方 在 于 ， 为 了 描述 计算 ， 需 要 假 
装 0 地 址 处 有 一 个 type 型 的 结构 。 注 意 ， 由 于 并 没有 引用 这 个 结构 ， 所 以 出 现 非法 
访问 的 可 能 性 很 小 。) 

关于 使 用 方面 的 提示 ， 参 见 问 题 2.16。 

参考 资料 : [8, Sec. 7.1. 6] 

[14, Sec. 3. 5. 4. 2] 
[11, Sec. 11. 1 pp. 292-293] 


2.1 


问 : 怎样 在 运行 时 用 名 字 访 问 结 构 中 的 域 ? 
答 : 创建 一 个 表 ， 保 存 名 称 和 用 offsetof() 宏 计算 出 的 域 偏 移 量 。 结 构 a 的 b 域 


的 偏 移 量 的 计算 方法 如 下 : 

of fsetb=offsetof (struct a, b) 

如 果 structp 是 个 结构 实例 的 指针 ， 而 域 b 是 int 型 ( 它 的 偏 移 量 如 上 式 计 算 〉， 
b 的 值 可 以 这 样 间接 地 设置 : 


*(int *) ((char *) structptoffsetb)=value; 


N 
—_ 
N 


: C0 语言 中 有 和 Pascal 的 with 等 价 的 语句 吗 ? 
: 参见 问题 20.28。 


1) 5 


N 
jp 
co 


问 : 既然 数组 名 可 以 用 作 数 组 的 基地 址 ， 为 什么 对 结构 不 能 这 样 ? 

答 : 导致 数组 引用 “退化 ?为 指针 的 规则 《参见 问题 6.3) 只 适用 于 数组 ， 这 反 
映 了 它们 在 C 语 言 中 的 “二 级 ”状态 。【〔 类 似 的 规则 也 适用 于 函数 。) 而 结构 却 是 
一 级 对 象 : 当 你 提 到 结构 的 时 候 ， 你 得 到 的 是 整个 结构 。 


N 
jà 
(dæ) 


问 : 程序 运行 正确 ， 但 退出 时 却 “core dump” (ASH) 了 ， 怎 么 回 
事 ? 
struct list { 
char *item; 
struct list *next; 
} 
/* Here is the main program. */main (argc, argv) 
Lane! 
答 : 结构 声明 的 末尾 缺少 的 一 个 分 号 使 main 被 定义 为 返回 一 个 结构 。 (由 于 
中 间 的 注释 行 ， 这 个 联系 不 容易 看 出 来 ) 。 因 为 ， 一 般 而 言 ， 返 回 结构 的 函数 在 
实现 时 ， 会 加 入 一 个 隐 含 的 返回 指针 ， 这 样 产生 的 main 函 数 代码 试图 接受 3 个 参 


数 ， 而 实际 上 只 有 两 个 传 入 (这 里 ， 由 C 的 启动 代码 传 入 ) 。 参 见 问 题 10.9 和 
16.5。 
参考 资料 : [22, Sec. 2. 3 pp. 21-22] 


问 : 结构 和 联合 有 什么 区 别 ? 

答 : 联合 本 质 上 是 一 个 成 员 相 互 重合 的 结构 ， 某 一 时 刻 你 只 能 使 用 一 个 成 
员 。【〔 也 可 以 从 一 个 成 员 写 入 ， 然 后 从 为 一 个 成 员 读 出 ， 来 检查 茶 种 类 型 的 二 进 
制 模式 ， 或 者 用 不 同 的 方法 解释 它们 。 但 很 明显 ， 这 样 做 跟 机 器 紧密 相关 。) 联 
合 的 大 小 是 它 的 最 大 成 员 的 大 小 ， 而 结构 的 大 小 是 它 的 所 有 成 员 大 小 之 和 。 《两 
种 情况 下 的 大 小 都 有 可 能 因为 填充 而 增加 。 参 见 问题 2.13 和 2.14。) 


N 
N 
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问 : 有 办 法 初始 化 联合 吗 ? 
答 : 在 原来 的 ANSI C 中 ， 只 有 联合 中 的 第 一 个 命名 成 员 可 以 被 初始 化 。C99 
引入 了 “指定 初始 式 ”， 可 以 用 来 初始 化 任意 成 员 。 
参考 资料 : [19, Sec. 6.8 pp. 148-149] 
[8, Sec. 6. 5. 7] 
[9, Sec. 6.5. 8] 
[11, Sec. 4.6.7 p. 100] 


N 
N 
N 


问 : 有 没有 一 种 自动 方法 来 跟踪 联合 的 哪个 域 在 使 用 ? 
答 : 没有 。 你 可 以 自己 实现 一 个 显 式 带 标签 的 联合 : 
struct taggedunion { 

enum {UNKNOWN, INT, LONG, DOUBLE, POINTER} code; 


union { 


int 1; 

long |; 

double d; 

void *p; 
} u; 


}; 
当 你 编写 该 联合 时 ， 必 须 确 保 code 域 总 能 被 正确 设置 ， 编 译 器 不 能 自动 为 你 


做 这 些 事情 。 (C 语 言 中 的 联合 与 Pascal 中 的 变 体 记录 不 同 。) 


枚 举 


£2 


问 : 枚 举 和 一 组 预 处 理 的 #define 有 什么 不 同 ? 

答 : 只 有 很 小 的 区 别 。C 标 准 表 明 枚 举 为 整 型 ， 枚 举 和 常量 为 int 型 ， 因 此 它们 
都 可 以 和 其 他 整 型 类 别 自由 混用 而 不 会 出 错 。 (但 是 ， 假 如 编译 器 不 允许 在 未 经 
显 式 类 型 转换 的 情况 下 混用 这 些 类 型 ， 则 审慎 地 使 用 枚 举 可 以 捕捉 到 某 些 程序 错 
误 。) 

枚 举 的 一 些 优 点 : 自动 赋值 ， 调 试 器 在 检验 枚 举 变 量 时 ， 可 以 显示 符号 值 ; 
它们 服从 数据 块 作用 域 规则 。 ( 当 枚 举 变量 被 任意 地 和 其 他 类 型 混用 时 ， 编 译 器 
也 可 以 产生 非 致 命 的 警告 信息 ， 因 为 这 被 认为 是 坏 风 格 。) 一 个 缺点 是 程序 员 不 
能 控制 这 些 非 致命 的 警告 ， 有 些 程序 员 则 反感 于 无 法 控制 枚 举 变量 的 大 小 。 

参考 资料 : [19, Sec. 2.3 p. 39, Sec. A4. 2 p. 196] 

[8, Sec. 6. 1.2.5, Sec. 6. 5. 2, Sec. 6. 5. 2. 2, Annex F] 
[11, Sec. 5.5 pp. 127-129, Sec. 5.11.2 p.153] 


N 
N 
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问 : 枚 举 可 移植 吗 ? 

答 : 枚 举 是 比较 晚 加 入 C 语 言 的 (在 K&R1 中 还 没有 枚 举 ) ， 但 它 现在 绝对 
是 C 语 言 的 一 部 分 了 。C 标 准 包 含 它 ， 所 有 的 现代 编译 器 也 支持 它 。 它 的 可 移植 性 
也 很 好 ， 不 过 由 于 它们 在 准确 定义 在 历史 上 的 不 确定 性 ， 它 们 在 标准 中 的 规格 说 
明 有 些 弱 。 (参见 问题 2.23。) 


N 
N 
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问 : 有 什么 显示 枚 举 值 符号 的 容易 方法 吗 ? 


答 : 没有 。 你 可 以 写 一 个 小 函数 ， 把 一 个 枚 举 常 量 值 映 射 到 字符 串 ， 或 者 通 
过 使 用 switch 语 句 ， 或 者 通过 搜索 数组 。 (就 调试 而 言 ， 一 个 好 的 调试 器 ， 应 该 
可 以 自动 显示 枚 举 第 量 值 符号 。) 


问 : 一 些 结构 声明 中 的 这 些 冒号 和 数字 是 什么 意思 ? 
struct record { 

char *name; 

int refcount : 4; 


unsigned dirty : 1; 


a 


答 : 这 是 位 域 (bitfield) 。 数 字 表 示 该 域 用 位 计量 的 准确 大 小 。 任 何 一 本 
完整 介绍 C 语 言 的 书 都 有 详细 介绍 。) 使 用 位 域 可 以 在 有 很 多 二 进 制 标 志和 其 他 
小 成 员 的 结构 中 节省 存储 空间 。 也 可 以 用 于 满足 外 部 要 求 的 存储 布局 。 位 域 在 
eee 
一 个 任务 时 的 成 功率 大 打折 扣 。 
注意 ， 用 冒 eee E MRE) 的 成 员 。 不 能 
用 这 种 方法 来 为 任意 变量 指定 大 小 。“【 人 参见 问 题 1.2 和 问题 1.3。 ) 
参考 资料 : [18, Sec. 6. 7, pp. 136-138] 
[19, Sec. 6. 9, pp. 149-150] 
[35, Sec. 3.5.2.1] 
[11, Sec. 5. 6.5, pp. 136-138] 


nd 


问 : 为 什么 人 们 那么 喜欢 用 显 式 的 掩 码 和 位 操作 而 不 直接 声明 位 域 ? 

答 : 人 们 认为 位 域 是 不 可 移植 的 ， 但 其 实 它 的 可 移植 性 并 不 比 C 语 言 的 其 他 
部 分 差 。 你 不 知道 它们 会 有 多 大 ， 但 其 实 int 类 型 的 值 也 是 如 此 。 你 不 知道 它 默 认 
否 是 有 符号 的 ， 但 其 实 char 类 型 也 是 如 此 。 你 不 知道 它 在 内 存 中 是 从 左 到 右 还 


rail 


是 从 右 到 左 排列 的 ， 但 其 实 所 有 的 类 型 都 是 如 此 。 识 且 ， 只 有 当 你 需要 满足 某 种 
外 界 规 定 的 存储 布局 时 ， 这 才 有 意义 。 (这 样 做 总 是 不 可 移植 的 。 参 见 问题 2.13 
和 20.5。) 

当 你 需要 对 一 些 二 进 制 位 作为 一 个 整体 操作 的 时 候 〈 例 如 复制 多 个 标志 
M) ， 位 域 也 会 有 些 不 便 。 不 能 创建 位 域 数 组 ， 参 见 问题 20.8。 很 多 程序 员 怀 疑 
编译 器 不 能 为 位 域 生 成 好 的 代码 ， 这 在 以 往 有 时 是 正确 的 。 

直接 使 用 位 域 蝇 无 疑问 比 等 价 的 显 式 的 位 屏蔽 操作 更 加 清晰 。 但 是 位 域 用 得 
NBME 


岂 ]. 值 得 一 提 的 是 ， 这 个 区 别 在 C++ 编译 器 和 某 些 模仿 C++ 的 C 纺 译 器 中 已 经 完全 
不 存在 了 。 在 C++ 中 ， 结 构 标 签 在 本 质 上 都 自动 声明 为 类 型 定义 。 


已 然而， 函数 传 入 和 传 出 大 结构 可 能 会 代价 很 大 《参见 问题 2.10) ， 因 此 你 也 许 
会 考虑 用 指针 蔡 代 《〈 当 然 ， 只 要 你 不 需要 按 值 传 参 ) 。 


第 3 章 表达 式 


C 语 言 的 设计 目标 之 一 就 是 高 效 的 实现 -一 让 C 语 言 的 编译 器 相对 较 小 ， 容 易 
写成 ， 同 时 也 更 容易 生成 较 好 的 代码 。 这 个 双重 目标 对 C 语 言 的 规范 有 人 至 关 重 要 
的 影响 ， 尽 管用 户 币 党 并 不 欣赏 这 样 的 暗示 ， 尤 其 是 当 他 们 习惯 于 一 些 定义 更 严 
格 的 语言 或 者 当 他 们 希望 语言 能 做 得 更 多 的 时 候 〈 例 如 ， 和 希望 语言 能 防止 自己 犯 


EIR) o 


求 信 顺序 


对 于 复杂 表达 式 中 的 各 个 子 表达 式 的 求 值 顺序 ， 编 译 器 有 相对 自由 的 选择 
权 。 可 能 跟 你 所 想 的 不 一 样 ， 编 译 吉 的 这 种 选择 跟 操 作 符 的 优先 级 和 结合 性 都 没 
有 什么 关系 。 编 译 器 选择 的 顺序 通常 并 无 实质 影响 ， 除 非 有 多 个 可 见 的 副作用 或 
者 某 个 变量 同时 受到 多 个 副作用 的 影响 ， 而 这 种 情况 下 的 行为 可 能 是 未 定义 的 。 


3.1 


问 : 为 什么 这 样 的 代码 不 行 ? 
ali]=i++; 
答 : 子 表达 式 it+ 有 一 个 副作用 一 一 它 会 改变 的 值 一 由 于 i 在 同一 表达 式 的 其 
他 地 方 被 引用 ， 因 此 这 会 导致 未 定义 的 行为 。 无 从 判断 该 引用 (左边 的 a 中 中 〉 是 
旧 值 还 是 新 值 。 注 意 ， 尺 管 在 文献 [18] 中 认为 这 类 表达 式 的 行为 是 不 确定 的 ， 
但 C 标 准 却 强 烈 声明 它 是 未 定义 的 ， 参 见 问题 11.35。 
参考 资料 : [18, Sec. 2. 12] 
[19, Sec. 2. 12] 
[8, Sec. 6. 3] 
[11, Sec. 7.12 pp. 227-229] 


3.2 


问 : 使 用 我 的 编译 器 ， 下 面 的 代码 

int 1=7; 

printf ("%d\n", i++* i++); 

打印 出 49。 不 管 按 什么 顺序 计算 ， 难 道 不 该 是 56 吗 ? 

答 : 尽管 后 级 自 加 和 后 级 自 减 操 作 符 ++ 和 -- 在 输出 其 旧 值 之 后 才 会 执行 运 
算 ， 但 这 里 的 “之 后 ”的 含义 和 准确 定义 常常 被 误解 。 无 法 保证 自 增 或 自 减 会 在 放 


弃 变 量 原 值 之 后 和 对 表达 式 的 其 他 部 分 进行 计算 之 前 立即 进行 。 只 能 保证 变量 的 
更 新 会 在 表达 式 “ 完 成 ”之 前 的 某 个 时 刻 进行 (按照 ANSI C 的 术语 ， 在 下 一 个 “ 序 
列 点 ”之 前 ， 参 见 问题 3.9〉 。 本 例 中 ， 编 译 器 选择 使 用 变量 的 旧 值 相 乘 以 后 再 对 
二 者 进行 自 增 运算 。 
包含 多 个 不 确定 的 副作用 的 代码 的 行为 总 是 被 认为 未 定义 。《〈 简 而 言 之 , “多 
个 不 确定 副作用 ?是 指 在 同一 个 表达 式 中 使 用 导致 同一 对 象 修改 两 次 或 修改 以 后 又 
被 检查 的 自 增 、 自 减 和 赋值 操作 符 (++、--、=、+= 和 -= 等 ) 的 任何 组 合 。 这 是 一 
个 粗略 的 定义 ， 严 格 的 定义 参见 问题 3.9, “未 定义 ”的 含义 参见 问题 11.35。) 不 要 
试图 探究 这 些 东西 在 编译 器 中 是 如 何 实现 的 ， 更 不 用 说 编写 依赖 它们 的 代码 了 
《这 与 许多 C 教 科 书 上 的 欠 考 虑 练习 正好 相反 ) 。 正 如 Kernighan 和 Ritchie 明 智 地 
指出 , “如 果 你 不 知道 它们 在 不 同 的 机 器 上 如 何 实现 ， 这 样 的 无 知 可 能 恰恰 会 有 助 
于 保护 你 
参考 资料 : [18, Sec. 2. 12 p.50] 
[19, Sec. 2. 12 p. 54] 
[8, Sec. 6. 3] 
[11, Sec. 7.12 pp. 227-229] 
[22, Sec. 3.7 p. 47] 
[12, Sec.9.5 pp. 120-121] 


3.3 


问 : 对 于 代码 

int i=3; 

1 二 1 二 十 ; 

不 同 编译 器 给 出 不 同 的 i 值 ， 有 的 为 3， 有 的 为 4， 哪 个 是 正确 的 ? 

答 : 没有 正确 答案 ， 这 个 表达 式 未 定义 。 参 见 问 题 3.1、3.9、3.10 和 11.35。 
同时 注意 ，i++ 和 ++i 都 不 同 于 计 1。 如 果 你 要 使 i 自 增 1， 使 用 i=i+1、i+=1、 计 + 或 
++i， 而 不 是 某 种 组 合 。 参 见 问题 3.14。 


3.4 


问 : 有 这 样 一 个 巧妙 的 表达 式 : 

a =b =a =b; 

它 不 需要 临时 变量 就 可 以 交换 a 和 b 的 值 。 

答 : 这 不 具有 可 移植 性 。 它 试图 在 序列 点 之 间 两 次 修改 变量 a， 而 这 种 行为 是 
未 定义 的 。 例 如 ， 有 人 报告 如 下 代码 : 

int a=123, b=7654; 

a =b =a =b ; 

在 SCO 优 化 C 编 译 器 (icc) 下 会 把 b 置 为 123， 把 a 置 为 0。 

参见 问题 3.1、3.9、10.3 和 20.18。 


3.5 


H: 可 否 用 显 式 括号 来 强制 执行 我 所 需要 的 计算 顺序 并 控制 相关 的 副作用 ? 
就 算 括号 不 行 ， 操 作 符 优先 级 是 否 能 够 控制 计算 顺序 呢 ? 

答 : 一 般 来 讲 ， 不 行 。 操 作 符 优先 级 和 显 式 括 号 对 表达 式 的 计算 顺序 只 有 部 
分 影响 。 在 如 下 的 代码 中 : 

fO+gO)* hO 

尽管 我 们 知道 乘法 运算 在 加 法 之 前 ， 但 这 并 不 能 说 明 这 3 个 函数 哪个 会 先 被 
调用 。 换 言 之 ， 操 作 符 优先 级 只 是 “部 分 ?地 决定 了 表达 式 的 求 值 顺序 。 这 里 的 “部 
分 ?并 不 包括 对 操作 数 的 求 值 。 

括号 告诉 编译 器 哪个 操作 数 和 哪个 操作 数 结 合 ， 但 并 不 要 求 编译 器 先 对 括号 
内 的 表达 式 求 值 。 在 上 边 的 表达 式 中 再 加 括号 

fO+(gOk hQ) 

也 无 助 于 改变 函数 调用 的 顺序 。 同 样 ， 对 问题 3.2 ”的 表达 式 加 括号 也 毫 无 帮 
助 ， 因 为 ++ 比 * 的 优先 级 高 : 

(i++)* (i++) /* WRONG */ 

这 个 表达 式 有 没有 括号 都 是 未 定义 的 。 

如 果 需 要 确保 子 表达 式 的 计算 顺序 ， 可 能 需要 使 用 显 式 的 临时 变量 和 独立 的 
语句 。 

参考 资料 : [18, Sec. 2. 12 p. 49, Sec. A.7 p. 185] 

[19, Sec. 2. 12 pp. 52-53, Sec. A. 7 p. 200] 


3.6 


问 : TR & &Fe| |G? 我 看 到 过 类 似 while((c=getchar ()) !=EOF & 
& co != An ) 的 代码 ……， 
答 : 这 些 操 作 符 在 此 处 有 一 个 特殊 的 “短路 ”例外 : 如 果 左 边 的 子 表达 式 决定 
最 终结 果 《〈 即 ， 真 对 于 | 和 假 对 于 有 区) 则 右边 的 子 表 达 式 不 会 计算 。 因 此 ， 从 左 
至 右 的 计算 可 以 确保 ， 对 逗号 表达 式 也 是 如 此 (但 参见 问题 3.8) 。 而 且 ， 所 有 这 
些 操 作 符 (包括 ?:〉 都 会 引入 一 个 额外 的 内 部 序列 点 (参见 问题 3.9) 。 
参考 资料 : [18, Sec. 2.6 p. 38, Secs. A7. 11-12 pp. 190-191] 
[19, Sec. 2.6 p. 41, Secs. A7. 14-15 pp. 207-208] 
[8, Sec. 6. 3. 13, Sec. 6. 3. 14, Sec. 6. 3. 15] 
[11,Sec. 7.7 pp.217- 218, Sec.7.8 pp. 218-220, Sec. 7. 12.1 
p. 229] 
[22, Sec. 3.7 pp. 46-47] 


au 


H: 是 否 可 以 安全 地 认为 ,一旦 及 及 和 | | 左边 的 表达 式 已 经 决定 了 整个 表达 
式 的 结果 ， 则 右边 的 表达 式 不 会 被 求 值 ? 
答 : 是 的 。 像 这 样 
和 
if(d !=0 && n / d> 0) 
{ /* average is greater than 0 */ } 
if (p==NULL || *p=="\0") 
{ /* no string */ } 
的 语句 在 C 语 言 中 十 分 常见 。 它 们 都 依赖 于 这 种 所 谓 的 “短路 ”行为 。 在 第 一 
个 例子 中 ， 如 果 没 有 短路 行为 ,一旦 d 等 于 0， 则 右边 的 表达 式 会 被 零 除 一 -系统 
可 能 会 月 溃 。 在 第 二 个 例子 中 ， 如 果 p 是 一 个 空 指针 ， 则 右边 的 表达 式 会 去 引用 
它 所 指向 的 内 存 ， 从 而 可 能 导致 系统 骨 溃 。 
参考 资料 : [35, Sec. 3. 3. 13, 3. 3. 14] 
[8, Sec. 6. 3. 13, 6. 3. 14] 


[11, Sec. 7.7 pp. 217-218] 
3.8 


问 : 为 什么 表达 式 

printf ("%d %d", f1(), £20); 

先 调用 了 f2? 我 觉得 过 号 表达 式 应 该 确保 从 左 到 右 的 求 值 顺序 。 

答 : 逗号 表达 式 的 确 可 以 确保 从 左 到 右 的 求 值 顺序 ， 但 用 逗号 分 隅 的 函数 参 
数 不 是 各 号 操作 符 。[11 函 数 调 用 的 参数 的 求 值 顺序 是 不 确定 的 。 参见 问题 
11.35。) 
参考 资料 : [18, Sec. 3.5 p. 59] 

[19, Sec. 3.5 p. 63] 
[35, Sec. 3. 3. 2. 2] 
[8, Sec. 6.3.2.2] 
[11, Sec. 7.10 p. 224] 


3.9 


问 : 怎样 才能 理解 复杂 表达 式 并 避免 写 出 未 定义 的 表达 式 ? “序列 点 ”是 什 


N 
~“ 


答 : 序列 点 是 一 个 时 间 点 ， 此 刻 侍 埃 落 定 ， 所 有 的 副作用 都 已 确保 结 

C 语 言 标准 中 提 及 的 序列 点 包括 ;: 

完整 表达 式 (full expression， 表 达 式 语句 或 不 为 任何 其 他 表达 式 的 子 表达 式 
的 表达 式 ) 的 尾部 ; 

|. && 、?: 或 逗号 操作 符 处 ; 

函数 调用 时 《参数 求 值 完毕 ， 函 数 被 实际 调用 之 前 ) 。 

ANSI/ISO C 标 准 这 样 描述 : 

在 上 一 个 和 下 一 个 序列 点 之 间 ， 一 个 对 象 所 保存 的 值 至 多 只 能 被 表达 式 的 求 
值 修改 一 次 。 而 且 只 有 在 确定 将 要 保存 的 值 的 时 候 才 能 访问 前 一 个 值 。 

这 两 句 隐 雇 的 话 有 几 层 意思 。 首 先 ， 它 提 到 了 被 “前 一 个 和 后 一 个 序列 点 ?分 
隔 的 操作 。 这 些 操作 通常 就 与 完整 表达 式 有 关 。 “在 表达 式 语 句 中 , “下 一 个 序列 


RUA TARAS, MRS it EAR INR ODS o URI 
文 所 述 ， 表 达 式 也 可 能 包含 中 间 序 列 点 。) 

第 一 句 话 就 排除 了 问题 3.2 和 3.3 的 两 个 例子 it+* it+ 和 i=i++。 两 个 表达 式 中 的 
ji 值 都 《在 两 个 序列 点 之 间 ) 被 修改 了 两 次 。 《如果 我 们 真 的 写 一 个 有 内 部 序列 点 
的 类 似 表达 式 ， 如 it+& & i++， 就 是 定义 明确 的 ， 尽 管 并 不 一 定 有 用 。) 

第 二 句 话 很 不 好 理解 。 这 句 话 禁 止 了 像 问 题 3.1 中 的 afij=i++ 这 样 的 代码 。 
(事实 上 ， 前 面 讨论 的 其 他 表达 式 也 违反 了 这 句 话 。) 要 理解 为 什么 ， 先 来 看 看 
标准 允许 和 禁止 什么 。 

很 显然 ， 像 as=b 和 c=d+e 这 样 读 取 一 些 变量 然后 写 入 其 他 变量 的 表达 式 是 定义 
明确 和 严格 合法 的 。 显 然 [2]， 像 =it++ 这 样 两 次 修改 同一 个 变量 的 表达 式 是 绝 不 允 
许 的 (或 者 ， 无 论 如 何 都 无 需 明确 定义 ， 也 就 是 说 ， 无 需 知道 它们 到 底 做 什么 ， 
Si PERS HL Nh STEP ECA]. ) 这 样 的 表达 式 被 第 一 句 话 禁止 。 

同样 显然 的 是 ， 和 希望 禁止 af[ij=i++ 这 样 一 边 修改 一 边 使 用 ji 值 的 表达 式 ， 但 却 
允许 i=i+1 这 样 既 修 改 又 使 用 ji 值 的 表达 式 ， 因 为 修改 只 发 生 在 变量 〈 此 处 是 i) 的 
最 终 值 的 存储 不 会 影响 对 变量 的 前 期 访问 的 时 候 。 

这 正 是 第 二 句 话 要 表达 的 意思 : 如 果 某 个 对 象 需要 写 入 一 个 完整 表达 式 中 ， 
则 在 同一 表达 式 中 对 该 对 象 的 访问 应 该 只 局 限于 用 来 计算 将 要 写 入 的 值 。 这 条 规 
则 有 效 地 限制 了 只 有 能 确保 在 修改 之 前 才 访问 变量 的 表达 式 为 合法 表达 式 。 老 式 
的 备用 写法 i=i+1 之 所 以 合法 ， 是 因为 对 i 的 访问 只 是 为 了 计算 的 最 终 值 。 而 
a[i]=i++ 非 法 乃 是 因为 对 i 的 一 处 访问 (a 自 ) 与 最 终 存储 在 i 中 的 值 〈 通 过 i++ 计算 
而 得 ) 唉 无 关系 。 这 样 导 致 没有 什么 好 办 法 来 决定 这 次 访问 是 应 该 放 到 i 的 自 增 之 
前 还 是 之 后 来 进行 一 对 我 们 和 编译 器 来 说 都 有 这 个 问题 。 因 为 没有 什么 好 办 法 
来 决定 ， 所 以 标准 宣称 它 是 未 定义 的 ， 可 移植 程序 中 就 不 应 该 使 用 这 样 的 语句 。 

参见 问题 3.10 和 3.12。 

参考 资料 : [8,Sec.5.1.2.3, Sec. 6. 3, Sec. 6. 6, Annex C] 

[14, Sec. 2. 1. 2. 3] 
[11, Sec. 7.12.1 pp. 228-229] 


3.10 


问 : 在 a[i]=i++; 中， 如 果 不 关心 a[] 的 哪 一 个 分 量 会 被 写 入 ， 这 段 代 码 就 没 


有 问题 ，i 也 的 确 会 增加 1， 对 吗 ? 

答 : 不 对 。 首 先 ， 既 然 你 不 关心 a[] 的 哪个 分 量 会 被 写 入 ， 那 为 什么 还 使 用 看 
上 去 好 像 要 写 入 a[] 的 代码 呢 ? 更 重要 的 是 ， 一 旦 一 个 表达 式 或 程序 未 定义 ， 则 它 
的 所 有 方面 都 会 变 成 未 定义 。 当 一 个 未 定义 的 表达 式 显然 有 两 种 似是而非 的 解释 
的 时 候 ， 不 要 误导 自己 ， 想 当然 地 认为 编译 器 会 选择 一 种 或 另 一 种 解释 。 标 准 没 
有 要 求 编 译 器 做 出 明确 的 选择 ， 有 的 编译 器 的 确 也 没有 。 在 这 里 ， 不 仅 不 知道 a[j] 
或 a[i+1] 是 否 被 写 入 ， 而 且 可 能 是 数组 的 一 个 毫 不 相干 的 分 量 〈 或 者 某 个 随机 的 内 
FMA) 被 写 入 了 ， 同 时 的 最 终 值 也 是 不 可 预测 的 。 

参见 问题 3.2、3.3、11.35 和 11.38。 


W 
j= 
j= 


问 : 人 们 总 是 说 ji=i++ 的 行为 是 未 定义 的 。 可 我 刚刚 在 一 个 ANS1 编 译 器 上 党 
试 过 ， 其 结果 正如 我 所 期 望 的 。 
答 : 参见 问题 11.38。 


3.12 


问 : 我 不 想 学 习 那 些 复杂 的 规则 ， 怎 样 才 能 避免 这 些 未 定义 的 求 值 顺序 问题 
呢 ? 

答 : 最 简单 的 答案 是 ， 如 果 避 开 那 些 没有 明显 合理 的 解释 的 表达 式 ， 也 就 避 
开 了 未 定义 的 表达 式 。 (当然 , “明显 合理 ?对 不 同 的 人 有 不 同 的 含义 。 只 要 同意 
a[i]=i++ 和 i=i++ 没 有 明显 合理 的 解释 ， 这 个 答案 就 有 效 。) 

更 准确 一 些 ， 有 几 条 简单 的 规则 ， 比 标准 的 要 求 略 微 保守 ， 但 可 以 确保 你 的 
代码 “明显 合理 ”， 而 且 对 于 编译 器 和 你 的 同事 都 同样 易于 理解 。 

(1) 确 保 一 个 表达 式 最 多 只 修改 一 个 对 象 : 一 个 简单 变量 、 一 个 数组 成 员 或 者 
一 个 指针 指向 的 位 置 ( 例 如 *p)〉) 。“ 修 改 ” 是 指 = 操 作 符 的 简单 赋值 ，+=、-= 或 *= 
操作 符 的 复合 赋值 或 者 ++ 或 -- 操 作 符 的 自 增 或 自 减 〈 前 级 或 后 级 形式 〉。 

(2) 如 果 一 个 (如 上 定义 的 ) 对 象 在 一 个 表达 式 中 出 现 一 次 以 上 而 且 在 表达 式 
中 被 修改 ， 则 要 确保 对 该 对 象 的 所 有 读 访 问 都 被 用 于 计算 它 的 最 终 值 。 这 条 规则 
允许 表达 式 i=i+1 一 尽管 出 现 了 两 次 而 且 也 被 修改 了 ， 但 对 i 的 旧 值 读 取 (= 号 右 


侧 ) 是 用 于 计算 i 的 新 值 。 

(3) 如 果 想 破坏 第 一 条 规则 ， 就 要 确保 修改 的 对 象 互 不 相同 。 同 时 ， 尽 量 限制 
到 最 多 2 至 3 个 修改 并 参照 下 面 例子 的 风格 。 Ree eins or 
二 条 规则 。) 

在 这 条 规则 下 ，c=*p++ 是 合法 的 ， 因 为 修改 的 两 个 对 象 (c 和 p) 不 相同 。 表 
达 式 *p++=c 也 是 允许 的 ， 因 为 p 和 *p《〈 即 p 本 身 和 它 所 指 的 对 象 ) 虽然 都 被 修改 
了 ， 但 它们 几乎 确定 不 会 相同 。 类 似 地 ，c=a[i++] 和 af[i++]=c 也 是 允许 的 ， 因 为 
c、i 和 af 可 以 假定 互 不 相同 。 最 后 ， 在 这 些 修改 3 个 或 3 个 以 上 对 象 的 表达 式 中 ， 
如 在 *p++=*#dq++ 中 的 p、q、 和 郑 以 及 af[i++]=b[j++] 中 的 i、j 和 a[ij， 如 果 所 有 的 3 个 
对 象 都 互 不 相同 ， 亦 即使 用 了 两 个 不 同 的 指针 p 和 q 或 者 两 个 不 同 的 数组 下 标 i 和 
j， 则 是 允许 的 。 

(4 如果 在 两 次 修改 或 修改 和 访问 之 间 置 入 定义 的 序列 点 操作 符 ， 则 可 以 破坏 
第 一 条 规则 和 第 二 条 规则 。 这 个 表达 式 〈 通 常 在 一 个 while 循 环 中 看 到 ， 用 来 读 入 
一 行内 容 ) 是 合法 的 ， 因 为 第 二 次 访问 变量 c 出 现在 & & 引 入 的 序列 点 之 后 。 

(c=getchar ()) !=EOF & & c !='\n' 

如 果 没 有 序列 点 ， 这 个 表达 式 便 是 非法 的 。 因 为 右边 为 了 跟 nh 比 较 而 对 c 的 访 
问 并 没有 决定 左边 “将 被 存储 的 值 ”。 


其 他 的 表达 云 问 题 


C 语 言 处 理 同一 表达 式 中 的 各 类 操作 符 的 规则 相对 简单 。 通 常 这 些 规则 都 非 
常 简单 ， 但 问题 3.16 和 3.17 描 述 了 两 种 出 人 意料 的 情形 。 除 了 转换 意外 ， 本 节 中 
还 讨论 了 上 自 增 操作 符 和 条 件 〈 或 “三 元 ?) ?: 操 作 符 


Qa 
jp 
Qo 


问 : ++i 和 i++ 有 什么 区 

答 : 如 果 你 的 C 语 言 书 没有 说 明 它 们 的 区 别 ， 那 么 去 买 一 本 好 的 。 简 而 言 
之 : ++ti 在 i 存储 的 值 上 增加 1 并 癌 使 用 它 的 表达 式 “ 返 回 ” 新 的 、 增 加 后 的 值 ， 而 
it++ 对 i 增加 1， 但 返回 的 是 原来 的 、 未 增加 的 值 。 


e5] 
j= 
A 


问 : 如 果 我 不 使 用 表达 式 的 值 ， 那 我 应 该 用 i++ 还 是 ++i 来 做 自 增 呢 ? 

答 : 无 所 谓 。i++ 和 ++i 的 唯一 区 别 在 于 它们 向 包含 它们 的 表达 式 传 出 的 值 。 
没有 包含 它们 的 表达 式 的 时 候 《〈 即 它们 作为 独立 的 完整 表达 式 存 在 ) ， 两 种 形式 
完全 等 价 ， 只 是 对 i 自 增 而 已 。 

(至 于 它 给 出 自 增 之 前 还 是 之 后 的 值 无 关 紧 要 ， 因 为 这 个 值 并 不 使 用 。 

值得 一 提 的 是 ， 作 为 独立 的 完整 表达 式 ，i+=1 和 i=i+1 也 是 等 价 的， 而 且 
和 计 + 及 ++i 也 等 价 。 

但 在 C++ 中 应 该 优先 使 用 ++i。 

参见 问题 3.3。 

参考 资料 : [18, Sec. 2.8 p. 43] 

[19, Sec. 2.8 p. 47] 
[35, Sec. 3. 3. 2. 4, Sec. 3. 3. 3. 1] 
[8, Sec. 6.3.2. 4, Sec. 6. 3.3.1] 


[11, Sec. 7.4.4 pp. 192-193, Sec. 7.5.8 pp. 199-200] 


3.15 


问 : 我 要 检查 一 个 数 是 不 是 在 另外 两 个 数 之 间 ， 为 什么 if(a<b<<c) 不 行 ? 
答 : 这 样 的 关系 操作 符 都 是 二 元 的 ， 它 们 比较 两 个 操作 数 ， 然 后 返回 真 或 假 
《1 或 0) 结果 。 因 此 表达 式 ifla<b<c) 首 先 比 较 a 和 b 然 后 比较 其 结果 1 或 0 是 否 小 
于 c。《〈 为 了 看 得 更 清楚 ， 可 以 想象 写成 (a<b)<c， 因 为 这 就 是 编译 器 的 解 
释 。) 要 检查 一 个 数 是 不 是 在 另外 两 个 数 之 间 ， 可 以 使 用 这 样 的 代码 : 
if(a<b && b<c) 
参考 资料 : [18, Sec. 2.6 p. 38] 
[19, Sec. 2.6 pp. 41-42] 
[35, Sec. 3.3.8 Sec 3.3.9] 
[11, Secs. 7.6.4, 7.6.5 pp. 207-210] 


3.1 


问 : 为 什么 如 下 的 代码 不 对 ? 

int a=1000, b=1000; 

long int c=a * b; 

答 : 根据 C 的 整 型 提升 规则 ， 乘 法 是 用 int 进 行 的 ， 而 其 结果 可 能 会 在 提升 或 
赋 给 左边 的 long int 型 之 前 溢出 或 被 截 短 。 可 以 使 用 显 式 的 类 型 转换 ， 强 迫 乘法 以 
long 型 进行 : 

long int c=(long int)a * b; 

另 一 种 等 价 的 方法 是 : 

long int c=(long int)a * (long int)b; 

TER, (long inb(as*b) 不 能 达到 需要 的 效果 。 这 种 形式 的 显 式 类 型 转换 《〈 即 对 
乘法 的 结果 进行 转换 ) 与 对 左边 的 long int 赋 值 时 的 隐 式 类 型 转换 等 价 。 而 后 者 本 
来 也 会 发 生 。 跟 隐 式 转换 一 样 ， 这 个 转换 太 迟 了 ， 破 坏 已 经 发 和 后 了 。 

参考 资料 : [18, Sec.2.7 p. 41] 

[19, Sec. 2.7 p. 44] 


[35, Sec. 3. 2. 1.5] 
[8, Sec. 6.2.1.5] 
[11, Sec. 6.3.4 p. 176] 
[22, Sec. 3.9 pp. 49-50] 


3.17 


问 : 为 什么 下 面 的 代码 总 是 给 出 0? 

double degC, degF; 

degC=5.0 / 9 * (degF - 32); 

答 : 如 果 二 元 操作 符 的 两 个 操作 数 都 是 整数 ， 则 C 语 言 进行 整数 运算 ， 这 与 
表达 式 的 其 余部 分 的 类 型 无 关 。 在 这 个 例子 中 ， 整 数 操作 是 截断 除法 ， 结 果 是 5 / 
9=0。《 但 是 ， 应 该 注意 ， 子 表达 式 的 求 值 类 型 问题 并 不 仅 限 于 除法 ， 也 不 仅仅 
限于 int 型 。) 如果 将 其 中 一 个 操作 数 转 换 为 float 型 或 double 型 ， 或 者 使 用 浮 点 常 
数 ， 则 这 个 操作 就 会 如 你 所 愿 : 

或 

degC=(double)5 / 9 * (degF - 32); 

degC=5.0 / 9 * (degF - 32); 

注意 ， 类 型 转换 必须 作用 在 一 个 操作 数 上 ， 对 计算 结果 进行 转换 (如 (double) 
(5/9)*(degF - 32)) 没有 帮助 。 参 见 问题 3.16。 

参考 资料 : [18, Sec. 1.2 p. 10,Sec.2.7 p. 41] 

[19, Sec. 1.2 p. 10, Sec. 2.7 p. 44] 
[35, Sec. 3. 2. 1. 5] 

[8, Sec. 6. 2. 1.5] 

[11, Sec. 6. 3.4 p. 176] 


3.18 


问 ， 需 要 根据 条 件 把 一 个 复杂 的 表达 式 赋 给 两 个 变量 中 的 一 个 。 可 以 用 下 面 
这 样 的 代码 吗 ? 


((condition)? a : b)=compl icated_expression; 


答 : 不 能 。? 操 作 符 跟 多 数 操作 符 一 样 ， 可 以 生成 一 个 值 ， 而 不 能 被 赋值 。 
换言之 ，?: 不 能 生成 一 个 “ 左 值 ”〈lvalue) 。 如 果真 的 需要 ， 可 以 试 试 下 面 这 样 的 
*((condition)? &a : &b)=complicated_expression; 
(尽管 这 坚 无 优雅 可 言 。) 
参考 资料 : [35, Sec. 3. 3. 15, esp. footnote 50] 
[8, Sec. 6. 3. 15] 
[11, Sec. 7. 1 pp. 179-180] 


3.1 


P: 我 有 些 代码 包含 这 样 的 表达 式 。 
a? b=c : d 
有 些 编译 器 可 以 接受 ， 有 些 却 不 能 。 为 什么 ? 
答 : 在 C 语 言 原 来 的 定义 中 ，= 的 优先 级 是 低 于 ?的 ， 因 此 早期 的 编译 器 倾向 
于 这 样 解释 这 个 表达 式 : 
(a ? b)=(c : d) 
然而 ， 因 为 这 样 没什么 意义 ， 后 来 的 编译 器 都 接受 了 这 种 表达 式 ， 并 用 这 样 
的 方式 解释 (就 像 里 面 上 暗含 了 一 对 括号 〉: 
a ? (b=c): d 
里 ，= 号 的 左 操作 数 只 是 b， 而 不 是 非法 的 a ? bo bp LANSI/ISO C 标 准 中 
指定 的 语法 就 要 求 这 样 的 解释 。〔 标 准 中 关于 这 个 的 语法 不 是 基于 优先 级 的 ， 且 
指出 了 在 ?和 :符号 之 间 可 以 出 现任 何 表 达 式 ) 。 
问题 中 这 样 的 表达 式 可 以 点 无 问题 地 被 ANSI 编 译 占 接收 。 如 果 需 要 在 较 老 的 
编译 器 上 编译 ， 总 可 以 增加 一 对 内 部 括号 。 
参考 资料 : [18, Sec. 2. 12 p. 49] 
[35, Sec. 3. 3. 15] 
[8, Sec. 6. 3. 15] 
[14, Sec. 3. 3. 15] 


保护 规则 


“在 不 同类 型 间 提升 操作 数 的 相对 简单 的 处 理 规则 ”在 ANSUISO C 中 有 了 一 些 
轻微 的 改变 。 这 些 问题 讨论 了 这 些 改变 。 


3.20 


=]: “semantics of ‘>’ change in ANSI C” 的 警告 是 什么 意思 ? 

答 : 这 是 某 些 (可 能 过 分 热心 的 ) 编译 器 提出 的 警告 ， 指 出 有 些 代码 在 ANSI 
C 的 “ 值 保 护 ” 规 则 下 得 到 的 结果 可 能 跟 老 的 “无 符号 保护 ”规则 下 得 到 的 结果 不 同 。 

这 条 警告 的 措 群 令 人 困惑 ， 因 为 改变 的 实际 上 并 不 是 > 操作 符 的 语义 《事实 
上 ， 几 乎 所 有 的 C 操 作 符 都 可 能 出 现在 这 条 警告 信息 中 ) ， 而 是 当 两 个 不 同 的 类 
型 出 现在 二 元 操作 符 的 两 侧 或 者 对 短 的 整数 类 型 进行 提升 时 总 是 发 生 的 隐 式 类 型 
转换 语义 。 

《如 果 你 觉得 在 表达 式 中 没有 使 用 任何 无 符号 值 ， 那 么 罪魁 祸首 很 可 能 就 是 
strlen。 在 标准 C 中 strlen 返 回 size_t。 而 这 正 是 一 个 无 符号 类 型 。) 

参见 问题 3.21。 


3.21 


P: “无 符号 保护 ”和 “ 值 保护 ”规则 的 区 别 在 哪里 ? 

答 : 这 些 规则 涉及 无 符号 类 型 提升 到 “大 ”类 型 时 的 行为 。 是 要 提升 为 一 个 较 
大 的 有 符号 还 是 无 符号 类 型 ? (提示 ， 这 取决 于 较 大 类 型 是 否 真 的 较 大 。) 

在 “无 符号 保护 ”( 也 称 为 “符号 保护 ” 规则 下 ， 提 升 的 类 型 总 是 无 符号 的 。 
这 个 规则 的 优点 是 简单 明了 ， 但 是 结果 可 能 会 出 人 意料 (参见 下 面 的 第 一 个 例 
Tia 

在 “ 值 保护 ”规则 下 ， 转 换取 决 于 原来 类 型 和 提升 类 型 的 实际 大 小 。 如 果 提 升 
类 型 的 确 较 大 -一 就 是 说 它 可 以 用 有 符号 值 表达 原来 类 型 的 所 有 无 符号 值 一 则 提 


升 后 的 类 型 为 有 符号 类 型 。 如 果 这 两 种 类 型 的 大 小 实际 上 是 一 样 的 ， 则 提升 后 的 
类 型 为 无 符号 型 〈 如 同 无 符号 保护 规则 ) 。 

由 于 使 用 了 类 型 的 实际 大 小 来 做 决定 ， 其 结果 在 不 同 的 机 器 上 可 能 不 一 样 。 
某 些 机 器 上 short int 比 ipt 小， 而 在 另 一 些 机 器 上 它们 的 大 小 可 能 是 一 样 。 某 些 机 器 
上 int 比 long int 小 ， 而 在 男 一 些 机 器 上 它们 的 大 小 可 能 也 是 一 样 的 。 

在 实际 使 用 中 ， 当 二 元 操作 符 的 一 个 操作 数 是 《或 者 提升 到 ) int 而 另 一 个 操 
作 数 可 能 (根据 提升 规则 〉 是 int 或 unsigned int 型 时 ， 无 符号 和 值 保 护 规则 的 区 别 
最 大 。 如 果 一 个 操作 数 是 unsigned int， 而 另 一 个 会 被 转换 为 这 个 类 型 一 如 果 其 值 
为 负 的 话 ， 这 一 定 会 导致 不 可 预料 的 结果 《参见 下 边 的 第 一 个 例子 ) 。 建 立 ANSI 
C 标 准 的 时 候 ， 为 了 减少 这 种 出 平 意料 的 结果 而 选择 了 值 保 护 规则 。( 男 一 方 
面 ， 值 保护 规则 也 减少 了 可 预测 的 情况 ， 因 为 可 移植 的 程序 不 能 依赖 某 种 机 器 上 
特定 类 型 的 大 小 。) 

这 个 假想 的 例子 显示 了 无 符号 保护 规则 下 可 能 出 现 的 意外 : 

unsigned short us=10; 

int i=-5; 

if (i> us) 

printf ("whoops!\n") ; 

重要 之 处 在 于 表达 式 i> us 如 何 求 值 。 在 无 符号 保护 规则 《〈 以 及 在 短 整 型 和 普 
通 整 型 一 样 大 的 机 器 上 的 值 保护 规则 ) 下 us 会 被 提升 为 unsigned int。 通 党 的 整 型 
提升 规则 表明 ， 如 果 unsigned int 和 int 出 现在 二 元 操作 符 两 侧 ， 则 两 个 操作 数 都 会 
转换 成 unsigned int。 因 此 i 也 被 转 成 unsigned int 了 。i 的 原 值 -5 被 转换 成 了 一 个 很 大 
的 无 符号 值 〈 在 16 位 机 器 上 是 65 531) 。 这 个 值 比 10 大 ， 因 此 这 段 代码 会 打印 
出 “whoops”。 

在 值 保护 规则 下 ， 如 果 机 器 的 普通 整 型 比 短 整 型 大 ， 则 us 会 被 转换 成 普通 整 
型 〈 从 而 保留 它 的 值 10) ， 而 ji 则 仍然 是 普通 的 整 型 。 这 样 ， 表 达 式 不 为 真 ， 也 不 
会 打印 出 任何 内 容 。〔 要 和 弄 明白 为 什么 只 有 当 有 符号 类 型 比较 大 的 时 候 才 能 保护 
值 ， 请 记 住 像 40 ”000 这 样 的 值 只 能 用 一 个 16 位 的 无 符号 整数 表示 ， 而 不 能 用 一 个 
有 符号 整数 表示 。) 

可 是 ， 值 保护 规则 也 不 能 防止 所 有 的 意外 。 在 短 整 型 和 普通 整 型 一 样 大 的 机 
器 上 ， 上 边 的 代码 依然 会 打印 出 “whoops” 来 。 而 且 值 保护 规则 还 会 引入 它 上 自己 的 


男 外 一 些 意外 一 -考虑 下 边 的 代码 : 
unsigned char uc=0x80; 
unsigned long ul=0; 
ul |=uc<<8; 
printf ("Ox%lx\n", ul); 
uc 在 向 左 移 位 之 前 会 被 提升 。 在 无 符号 保护 规则 下 ， 它 会 被 提升 为 unsigned 
int 型 ， 代 码 因 此 会 如 愿 打 印 出 0x8000。 然 而 ， 在 值 保护 规则 下 ，uc 会 被 提升 为 
signed int (只 要 int 比 char 大 ， 这 总 是 成 立 的 ) 。 中 间 结 果 uc<< 和 8 会 遇 到 unsigned 
long 型 的 ul。 有 符号 的 中 间 结 果 也 需要 提升 。 如 果 int 型 比 long 型 小 ， 则 中 间 结 果 会 
进行 市 符号 提升 ， 在 32 位 机 上 ， 它 会 变 成 0xffff8000。 在 这 样 的 机 器 上 ， 上 述 代 码 
会 打印 出 0xffff8000， 这 慌 怕 不 是 原来 所 希望 的 结果 。 “如 果 机 器 的 int 和 long 型 大 
小 一 致 ， 则 在 任何 一 种 规则 下 ， 上 述 代码 都 会 打印 出 0x8000 来 。) 
要 避免 意外 《无 论 哪 种 规则 下 的 ， 或 是 因为 规则 的 意外 修改 导致 的 ) ， 最 好 
的 办 法 是 避免 在 同一 个 表达 式 中 混用 有 符号 和 无 符号 的 变量 ， 尽 管 如 第 二 个 例子 
所 示 ， 这 个 规则 不 是 在 任何 时 候 都 足够 有 效 。 但 任何 时 候 ， 总 可 以 用 显 式 的 类 型 
转换 来 明确 无 误 地 表达 所 希望 的 转换 的 地 方 和 方式 。 问 题 12.45 和 16.8 中 有 相关 的 
例子 。《〈 有 些 编译 器 ， 如 果 探 测 到 有 歧义 的 类 型 转换 或 者 在 无 符号 保护 规则 下 会 
产生 不 一 样 行为 的 表达 式 ， 就 会 及 出 警告 信息 。 但 有 的 时 候 ， 这 些 警告 显得 太 多 
了 。 参 见 问题 3.20。 ) 
参考 资料 : [19, Sec. 2.7 p.44, Sec. A6.5 p. 198, Appendix C p. 260] 
[35, Sec. 3. 2. 1. 1, Sec. 3. 2. 1. 2, Sec. 3.2.1.5] 
[8, Sec. 6.2.1.1, Sec. 6.2.1.2, Sec. 6.2.1.5] 
[14, Sec. 3.2.1.1] 
[11, Secs. 6. 3.3, 6.3.4 pp. 174-177] 


岂 ]. 如 果 这 是 去 号 操作 符 ， 那 么 任何 函数 都 不 能 接受 一 个 以 上 的 参数 了 ! 
[21 当 然 ， 你 可 能 不 同意 ， 但 对 制定 标准 的 人 来 说 ， 这 是 显而易见 的 。 


第 4 章 指针 


旨 针 军 无 疑问 是 C 语 言 最 强大 和 最 流行 的 功能 之 一 ， 但 它 也 成 了 很 多 初学 者 
的 梦 厦 。 当 指针 指向 不 应 该 指向 的 位 置 时 ， 后 患 无 穷 。〔( 实 际 上 ， 很 多 与 指针 相 
关 的 问题 与 内 存 分 配 的 关系 更 为 密切 。 参 见 第 7 章 。) 


基本 的 指针 应 用 


4.1 


Ml: 指针 到 底 有 什么 好 处 ? 

答 : 它 的 好 处 太 多 了 ， 比 如 

动态 分 配 的 数组 (参见 问题 6.14 和 6.16); 

对 多 个 相似 变量 的 一 般 访问 ; 

(模拟 ) 按 引 用 传递 函数 参数 (参见 问题 4.8 和 20.1); 

各 种 动态 分 配 的 数据 结构 ， 尤 其 是 树 和 链表; 

遍历 数组 (例如 ， 解 析 字 符 串 》; 

高 效 地 、 按 引用 “复制 ”数组 和 结构 ， 特 别 是 作为 函数 参数 的 时 候 。 
(请 注意 ， 这 并 非 一 个 完整 的 列表 ! ) 


4.2 


问 : 我 想 声明 一 个 指针 并 为 它 分 配 一 些 空 间 ， 但 却 不 行 。 下 面 的 代码 有 什么 
问题 呢 ? 

char *p; 

*p=mal loc (10) ; 

SB: 你 声明 的 指针 是 p， 而 不 是 *p， 当 操作 指针 本 身 时 例如 当 你 对 其 赋 
值 ， 使 之 指向 别处 时 ) ， 只 需要 使 用 指针 的 名 字 即 可 : 


p=mal loc (10) ; 
当 操 作 指 针 所 指向 的 内 存 时 ， 才 需要 使 用 * 作 为 间接 操作 符 : 
*p=' H' ; 


然而 ， 如 果 像 下 边 这 样 在 局 部 变量 的 声明 中 使 用 malloc 调 用 作为 初始 式 : 
char *p=mal loc (10) ; 
则 很 容易 会 犯 下 问题 中 的 错误 。 


在 把 一 个 初始 化 的 指针 声明 分 成 一 个 声明 和 一 个 后 续 赋 值 的 时 候 ， 要 记得 去 
掉 * 号 。 

总 之 ， 在 表达 式 中 ，p 是 指针 ，*p 是 它 指 癌 的 内 容 〈 在 这 个 例子 中 是 一 个 
char) 。 参 见 问题 1.21、7.1、7.5 和 8.3。 

参考 资料 : [22, Sec. 3. 1 p. 28] 


4.3 


问 : *p++ 自 增 p 还 是 p 所 指向 的 变量 ? 

B: 后 级 ++ 和 -- 操 作 符 本 质 上 比 前 级 一 元 操作 符 的 优先 级 高 ， 因 此 *p++ 和 * 
(p++) 等 价 ， 它 自 增 p 并 返回 p 自 增 之 前 所 指向 的 值 。 要 自 增 p 指 向 的 值 ， 则 使 用 
(*p)++， 如 有 果 副 作用 的 顺序 无 关 紧 要 也 可 以 使 用 ++*p。 

参考 资料 : [18, Sec. 5.1 p.91] 

[19, Sec. 5. 1 p. 95] 

[8, Sec. 6. 3. 2, Sec. 6. 3. 3] 

[11, Sec. 7.4.4 pp. 192-193, Sec.7.5 p.193, Secs.7.5.7,7.5.8 
pp. 199-200] 


指针 操作 


4.4 


Pl: 我 用 指针 操作 int 数 组 的 时 候 遇 到 了 麻烦 。 下 边 的 代码 有 什么 问题 ? 
int array[5], i, *ip; 
for (i=0; i<5; i++)array[i]=i; 
ip=array; 
printf ("%d\n", *(ipt3 * sizeof (int))); 
我 以 为 最 后 一 行 会 打印 出 3， 但 它 打印 了 一 堆 垃 圾 信息 。 
答 : 你 做 了 一 些 无 用 功 。C 语 言 中 的 指针 算术 总 是 自动 地 采纳 它 所 指向 的 对 
象 的 大 小 。 你 所 需要 的 就 是 : 
printf ("%d\n", *(ipt+3)) ; /kor ip[3]----- See Q 6. 3*/ 
这 就 可 以 打印 出 数组 的 第 三 个 元 素 。 在 类 似 的 代码 中 ， 你 无 需 考 虑 按 指针 指 
向 的 元 素 的 大 小 进行 计算 。 如 果 你 那样 计算 ， 会 不 经 意 地 访问 并 不 存在 的 数组 元 
素 。“ 根 据 你 的 机 器 上 sizeof(inb 的 大 小 ， 也 许 是 array[6]， 也 许 是 array[12]。 ) 
参考 资料 : [18, Sec. 5.3 p. 94] 
[19, Sec. 5. 4, p. 103] 
[35, Sec. 3. 3. 6] 
[8, Sec. 6. 3. 6] 
[11, Sec. 7.6.2 p. 204] 


4.5 


H: 我 有 一 个 char  * 型 指针 碰巧 指向 一 些 int 型 变量 ， 我 想 跳 过 它们 。 为 什 
ZA (Cint 六 )p)++; 这 样 的 代码 不 行 ? 

答 : 在 C 语 言 中 ， 类 型 转换 操作 符 并 不 意味 着 “把 这 些 二 进 制 位 看 作 另 一 种 类 
型 ， 并 作 相 应 的 处 理 ”。 这 是 一 个 转换 操作 符 ， 根 据 定义 它 只 能 生成 一 个 右 值 


Grvalue)。 而 右 值 既 不 能 赋值 ， 也 不 能 用 ++ 自 增 。《 如 果 编 译 器 接受 这 样 的 表达 
式 ， 那 要 么 是 一 个 错误 ， 要 么 是 有 意 作 出 的 非 标准 扩展 。) 要 达到 你 的 目的 可 以 
用 : 
p=(char *) ((int *)p+1); 
或 者 ， 因 为 p 是 char* 型 ， 直 接 用 
pt=sizeof (int); 
要 想 真 正明 白 无 误 ， 你 得 用 
int *ip=(int *)p; 
p=(char *) (ip+1) ; 
但 是 ， 可 能 的 话 ， 你 还 是 应 该 一 开始 就 选择 适当 的 指针 类 型 ， 而 不 是 一 味 地 
WAZ. BRA: [19,Sec.A7.5 p.205] 
[35,Sec.3.3.4 esp.footnote 44] 
[8,Sec.6.3.4] 
[14,Sec.3.3.2.4] 
[11,Sec.7.1 pp.179-180] 


4.6 


问 : 为 什么 不 能 对 void # 指 针 进 行 算术 操作 ? 
答 : 参见 问题 11.26。 


4.7 
问 : 我 有 些 解 析 外 部 结构 的 代码 ， 但 是 它 却 月 江 了 ， 显示 出 了 “unaligned 


J, 
access” (未 对 齐 的 访问 ) 的 信息 。 这 是 什么 意思 ? 
答 : 参见 问题 16.8。 
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4.8 


问 : 我 有 个 函数 ， 它 应 该 接受 并 初始 化 一 个 指针 : 

void f (int *ip) 

{ 

static int dummy=5; 
i p= & dummy ; 

} 

但 是 当 我 如 下 调用 时 : 

int *ip; 

f (ip) ; 

调用 者 的 指针 没有 任何 变化 。 

答 : 你 确定 函数 初始 化 的 是 你 希望 它 初始 化 的 东西 吗 ? 请 记 住 在 C 语 言 中 ， 
参数 是 通过 值 传递 的 。 上 述 代 码 中 被 调 函 数 仅 仅 修改 了 传 入 的 指针 副本 。 为 了 达 
到 期 望 的 效果 ， 你 需要 传 入 指针 的 地 址 〈 函 数 变 成 接受 指向 指针 的 指针 ) : 

void f (ipp) 

int **ipp; 


{ 


static int dummy=5; 
* | pp= & dummy ; 


int *ip; 
f(& ip); 
这 里 ， 实 际 上 在 模拟 通过 引用 传递 参数 。 另 一 种 方法 是 让 函数 返回 指针 ; 
int *f () 


static int dummy=5; 
return &dummy; 


} 


int *ip=f() ; 
参见 问题 4.9 和 4.11。 


4.9 
问 : 能 否 像 下 边 这 样 用 void ”六 通用 指针 作为 参数 ， 使 辑 数 模拟 按 引 用 传递 


void f (void **); 

double *dp; 

f((void **) &dp) ; 

答 : 不 可 移植 。 这 样 的 代码 可 能 有 效 ， 而 且 有 时 鼓励 这 样 用 ， 但 是 它 依 赖 一 
种 假设 一 所 有 指针 的 内 部 表示 都 是 一 样 的 (这 很 常见 但 并 不 一 定 如 此 。 参 见 问 
题 5.17。 ) 

C 语 言 中 没有 通用 的 指针 类 型 。void * 可 以 用 作 通 用 指针 只 是 因为 当 它 和 其 他 
类 型 相互 赋值 的 时 候 ， 如 果 需 要 ， 它 可 以 自动 转换 成 其 他 类 型 。 但 是 ， 如 果 试 图 
这 样 转换 所 指 类 型 为 void * 之 外 的 类 型 的 void *# 指 针 时 ， 就 不 会 上 自动 转换 了 。 当 
你 使 用 void ** 指 针 的 时 候 〈 例 如 ， 使 用 * 操 作 符 访问 void ** 指 针 所 指 的 void * 值 的 
时 候 ) ， 编 译 器 无 从 知道 void* 值 是 否 是 从 其 他 类 型 的 指针 转换 而 来 的 。 从 而 ， 编 
译 器 只 能 认为 它 仅仅 是 个 void * 指 针 ， 不 能 对 它 进行 任何 隐 式 的 转换 。 

换言之 ， 你 使 用 的 任何 void ”** 值 必须 的 确 是 某 个 位 置 的 void * 值 的 地 址 。 
(void**)&dp 这样 的 类 型 转换 虽然 可 以 让 编译 器 接受 ， 但 却 不 能 移植 ， 而 且 也 可 
能 不 会 达到 你 想 要 的 目的 。 参 见 问题 13.9。 如 果 void ** 指 针 指 向 的 值 不 是 void * 类 
型 ， 而 且 它 的 大 小 或 内 部 表示 和 void * 也 不 相同 ， 则 编译 器 就 不 能 正确 地 访问 


mp 
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要 使 上 边 的 代码 正确 工作 ， 你 需要 使 用 一 个 中 间 void * 变 量 : 
double *dp; 


void *vp=dp; 

f (&vp) ; 

dp=vp ; 

对 /从 wp 的 赋值 使 编译 器 有 机 会 在 需要 的 时 候 进 行 适 当 的 类 型 转换 。 

目前 ， 我 们 的 讨论 假设 的 是 不 同类 型 的 指针 可 能 具有 不 同 的 大 小 和 内 部 表 
示 。 这 种 情况 现在 已 经 很 少见 到 ， 但 也 并 非 完 全 没有 。 为 了 进一步 弄 清 void ** 的 
问题 ， 让 我 们 看 一 个 类 似 的 情形 ， 比 如 类 型 int 和 double。 它 们 可 能 大 小 不 一 样 ， 
而 且 肯 定 内 部 表示 也 不 一 样 。 假 如 有 这 样 的 函数 : 

void incme (double *p) 


{ 


*p+=1; 

} 

可 以 这 样 做 : 

int i=1; 

double d=i; 

incme ( &d) ; 

i=d; 

很 明显 ，i 增 加 了 1。 (这 跟 使 用 辅助 变量 vp 的 void ** 指 针 的 正确 代码 类 
似 。) 但 是 ， 假 如 想 这 样 : 

int 1=1; 

incme ( (double*) & 1) ; /*WRONG*/ 

跟 问 题 中 的 代码 类 似 ， 这 段 代 码 肯 定 不 会 正确 运行 。 


4.10 


问 : 我 有 一 个 函数 extern intf (int *);， 它 接受 指向 int 型 的 指针 。 我 怎样 
用 引用 方式 传 入 一 个 常量 ? PAF (&5) ;似乎 不 行 。 

答 : 在 C99 中 ， 你 可 以 使 用 “复合 字面 量 ”: 

f((int[]) {5}); 

在 C99 之 前 ， 你 不 能 直接 这 样 做 ， 必 须 先 定义 一 个 临时 变量 ， 然 后 把 它 的 地 
址 传 给 函数 : 


int five=5; 

f (&five) ; 

在 C 语 言 中 ， 接 受 指针 而 不 是 值 的 函数 可 能 往往 希望 修改 指针 指向 的 值 ， 
此 传 入 一 个 常数 指针 可 能 不 是 一 个 好 主意 。 事 实 上 ， 如 果 f 被 定义 成 接受 int *, 
向 它 传 入 const int 的 指针 的 时 候 需 要 诊断 。〔 如 果 函 数 能 够 保证 不 修改 传 入 指针 指 
向 的 值 ， 则 它 可 以 定义 成 接受 const int * 参 数 。) 参见 问题 2.11、4.8 和 20.1。 


4.11 


问 : 0 语言 可 以 “ 按 引 用 传 参 ” 吗 ? 
答 : 真 的 没有 。 严 格 地 讲 ，C 语 言 总 是 按 值 传 参 。 你 可 以 自己 模拟 按 引 用 传 
参 ， 定 义 接受 指针 的 函数 ， 然 后 在 调用 时 使 用 以 操作 符 。 事 实 上 ， 当 你 加 函数 传 
入 数组 〈 传 入 指针 的 情况 参见 问题 6.4 及 其 他 相关 问题 ) 时， 编译 嚣 本质 上 就 是 在 
模拟 按 引 用 传 参 。 但 是 C 没 有 任何 真正 等 同 于 按 引 用 传 参 或 C++ 引用 参数 的 东 
西 。 另 一 方面 ， 类 似 函 数 的 预 处 理 宏 可 以 提供 一 种 “ 按 名 称 传 参 ”的 形式 。 
参见 问题 48 和 20.1。 
参考 资料 : [18, Sec. 1.8 pp. 24-25, Sec. 5. 2 pp. 91-93] 
[19, Sec. 1.8 pp. 27-28, Sec. 5. 2 pp. 95-97] 
[8, Sec. 6. 3. 2. 2] 
[11, Sec. 9.5 pp. 273-274]. 


有 其 他 指针 问题 


= 


1 


问 : 我 看 到 了 用 指针 调用 函数 的 不 同 语法 形式 。 到 底 怎 么 回 事 ? 
答 : 最 初 ， 函 数 指针 必须 用 * 操 作 符 〈 和 一 对 括号 ) “转换 为 ”一 个 “真正 的 ” 函 
数 才能 调用 : 
int r, (*fp) (), func C) ; 
fp=func; 
r=(*fp) 0; 
最 后 一 行 的 解释 很 明确 : 印 是 一 个 函数 的 指针 ， 因 此 *fp 是 个 函数 。 在 括号 内 
加 上 函数 参数 列表 〈 再 在 *fp 外 加 上 一 对 括号 用 于 使 运算 的 优先 级 正确 ) ， 就 完成 
下 
而 函数 总 是 通过 指针 进行 调用 的 ， 所 有 “真正 的 ”函数 名 在 表达 式 和 初始 化 
中 ， 总 是 隐 式 地 退化 为 指针 。 参 见 问 题 1.36。 这 个 推论 表明 ， 无 论 包 是 函数 名 还 
是 函数 的 指针 ，r=fp0; 都 是 合法 的 且 能 正确 工作 。 这 种 用 法 没有 任何 歧义 ， 使 
用 函数 指针 后 跟 参 数列 表 的 方法 ， 除 了 调用 它 所 指 的 函数 之 外 ， 列 的 什么 也 做 不 
了 。) 使 用 显 式 的 * 号 依然 允许， 而 且 为 了 保证 在 较 老 的 编译 器 上 的 可 移植 性 ， 
这 也 是 推荐 的 用 法 。 
参见 问题 1.36。 
参考 资料 : [18, Sec. 5. 12 p. 116] 
[19, Sec. 5. 11 p.120] 
[8, Sec. 6. 3. 2. 2] 
[14, Sec. 3. 3. 2. 2] 
[11, Sec. 5. 8 p. 147, Sec. 7.4.3 p. 190] 


4.1 


问 : 通用 指针 类 型 是 什么 ? 当 我 把 函数 指针 赋 向 void FRAN, Ayia 
不 过 。 
答 : 没有 什么 “通用 指针 类 型 >。void = * 指 针 只 能 保存 对 象 〈 也 就 是 数据 ) 指 
针 。 将 函数 指针 转换 为 void  *# 指 针 是 不 可 移植 的 。《〈 在 某 些 机 器 上 ， 函 数 指针 可 
能 很 大 一 比 任何 数据 指针 都 大 。) 
但 是 ， 可 以 确保 的 是 ， 所 有 的 函数 指针 类 型 都 可 以 相互 转换 ， 只 要 在 调用 之 
前 转 回 了 正确 的 类 型 即 可 。 因 此 ， 可 以 使 用 任何 函数 类 型 (通常 是 int (*)() 或 void 
(*)0， 即 未 指明 参数 、 返 回 int 或 void 的 函数 ) 作为 通用 函数 指针 。 如 果 你 需要 一 
个 既 能 容纳 对 象 指针 又 能 容纳 函数 指针 的 地 方 ， 可 移植 的 解决 方案 是 使 用 包含 
void * 指 针 和 通用 函数 指针 任何 类 型 都 可 以 〉 的 联合 。 
参见 问题 1.22 和 5.8。 
参考 资料 : [35, Sec. 3. 1. 2. 5, Sec. 3. 2. 2. 3, Sec. 3. 3. 4] 
[8, Sec. 6.1.2.5, Sec. 6. 2. 23, Sec. 6. 3. 4] 
[14, Sec. 3. 2. 2. 3] 
[11, Sec. 5. 3.3 p. 123] 


4.1 


问 : 怎样 在 整 型 和 指针 之 间 进 行 转 换 ? 能 否 暂时 把 整数 放 入 指针 变量 中 ， 或 
者 相反 ? 

答 : 曾经 有 一 段 时 间 ， 可 以 确保 能 将 指针 转换 为 整数 (尽管 谁 也 不 知道 究竟 
是 需要 int 还 是 long 型 )， 将 整数 转换 为 指针 。 同 时 可 以 确保 指针 在 转换 为 (足够 
大 的 ) 整数 及 转换 回来 的 时 候 值 不 会 改变 ， 而 且 转 换 (及 任何 映射 都 不 应 该 “让 
那些 知道 机 器 寻 址 结构 的 人 感到 惊奇 "。 换 言 之 ， 有 整数 /指针 转换 的 先例 和 支 
持 ， 但 这 总 是 和 机 器 相关 的 ， 因 此 不 有 具 可 移植 性 。 而 且 总 是 需要 显 式 的 类 型 转换 
(但 是 就 算 你 忘 了 转换 ， 早 期 的 编译 器 也 几乎 不 会 报警 。) 

为 了 使 C 语 言 广泛 地 可 实现 ，ANSIISO C 标 准 削 弱 了 这 些 早期 的 保证 。 指 针 
到 整数 和 整数 到 指针 的 转换 变 成 了 实现 定义 的 《参见 问题 11.35) ， 因 此 也 就 没有 
了 指针 和 整数 可 以 无 需 修 改 就 相互 转换 的 保证 。 

强制 将 指针 转换 为 整数 和 将 整数 转换 为 指针 从 来 都 不 是 什么 好 的 实践 。 当 需 
要 同时 保存 两 种 类 型 数据 的 存储 结构 的 时 候 ， 使 用 联合 是 一 个 更 好 的 办 法 。 


参见 问题 5.18 和 19.30。 
参考 资料 : [18, Sec. A14. 4 p. 210] 
[19, Sec. A6. 6 p. 199] 
[35, Sec. 3. 3. 4] 
[8, Sec. 6. 3. 4] 
[14, Sec. 3. 3. 4] 
[11, Sec. 6.2.3 p. 170, Sec. 6.2.7 pp. 171-172] 


4.1 


H: 我 怎样 把 一 个 int 变 量 转换 为 char * 型 ? 我 试 了 类 型 转换 ， 但 是 不 行 。 

E: 这 取决 于 你 希望 做 什么 。 如 果 你 的 类 型 转换 不 成 功 ， 你 可 能 是 企图 把 整 
数 转换 为 字符 串 ， 这 种 情况 参见 问题 13.1。 如 果 你 试图 把 整数 转换 为 字符 ， 参 见 
问题 8.6。 如 果 你 试图 让 一 个 指针 指向 特定 的 内 存 地 址 ， 参 见 问题 19.30。 


Bom 空 指针 


对 于 每 种 指针 类 型 ，C 语 言 都 定义 一 个 特殊 的 指针 值 ， 即 空 指针 ， 它 可 以 确 
保 不 会 指向 这 种 类 型 的 任何 一 个 对 象 或 函数 。(C 语 言 中 的 空 指针 跟 Pascal 和 LISP 
语言 中 的 nil 指 针 类 似 。) C 程 序 员 常常 对 空 指 针 的 正确 使 用 和 它们 的 内 部 表示 
(尽管 内 部 表示 跟 多 数 程 序 员 都 没有 关系 ) 感到 困惑 。 在 源码 中 用 来 表示 空 指针 
的 空 指针 常量 使 用 整数 0， 且 在 很 多 机 器 上 都 在 内 部 采用 所 有 位 都 是 0 的 字 来 表示 
空 指 针 。 但 C 语 言 不 保证 第 二 点 。 

由 于 有 关 空 指针 的 疑惑 如 此 之 多 ， 本 章 对 其 进行 了 很 详尽 的 讨论 。( 问 题 
5.13 一 5.17 是 对 这 些 疑 或 本 身 的 回顾 。) 如 果 你 有 六 没有 这 里 的 许多 误解 或 者 觉 
得 讨论 太 过 琐碎 ， 你 可 以 直接 跳 到 5.15， 看 看 总 结 。 


空 指针 和 空 指针 常量 


前 面 的 3 个 问题 讨论 了 C 语 言 中 空 指 针 的 基本 含义 。 
5.1 


问 : 臭名 昭著 的 空 指针 到 底 是 什么 ? 

答 : 语言 定义 中 说 明 ， 每 一 种 指针 类 型 都 有 一 个 特殊 值 一 “ 空 指针 ”一 它 与 
同类 型 的 其 他 所 有 指针 值 都 不 相同 ， 它 “保证 与 任何 对 象 或 函数 的 指针 值 都 不 相 
等 "。 也 就 是 说 ， 空 指针 不 会 指向 任何 地 方 ， 它 不 是 任何 对 象 或 函数 的 地 址 。 取 地 
址 操作 符 有 永远 也 不 会 返回 空 指针 。 同 样 对 malloc 的 成 功 调用 也 不 会 返回 空 指 
et. 【如果 失 败 ，malloc 的 确 返回 空 指针 ， 这 是 空 指针 的 典型 用 法 : 表示 “未 分 
配 ?或 者 “尚未 指向 任何 地 方 ” 的 “特殊 ”指针 值 。) 

空 指 针 在 概念 上 不 同 于 未 初始 化 的 指针 。 空 指针 可 以 确保 不 指向 任何 对 象 或 
函数 ， 而 未 初始 化 的 指针 则 可 能 指 癌 任何 地 方 。 参 见 问题 1.31、7.1 和 7.35。 

如 上 文 所 述 ， 每 种 指针 类 型 都 有 一 个 空 指针 ， 而 不 同类 型 的 空 指针 的 内 部 表 
示 可 能 不 尽 相 同 。 尽 管 程序 员 不 必 知 道内 部 值 ， 但 编译 器 必须 时 刻 明 确 需要 哪 种 
空 指针 ， 以 便 在 需要 的 时 候 加 以 区 分 (参见 问题 5.2、5.5 和 5.6)。 

参考 资料 : [18, Sec. 5. 4 pp. 97-98] 

[19, Sec. 5. 4 p. 102] 

[8, Sec. ó. 2. 2. 3] 

[14, Sec. 3. 2. 2. 3] 

[11, Sec. 5.3.2 pp. 121-123] 


5.2 


问 : 怎样 在 程序 里 获得 一 个 空 指针 ? 
答 : 使 用 空 指针 常量 。 根 据 语言 定义 ， 在 指针 上 下 文中 的 “ 值 为 0 的 整 型 常量 


表达 式 ” 会 在 编译 时 转换 为 空 指针 。 也 就 是 次 ， 在 初始 化 、 赋 值 或 比较 的 时 候 ， 如 
果 一 边 是 变量 或 指针 类 型 的 表达 式 ， 编 译 器 可 以 确定 另 一 边 的 常数 0 为 空 指针 并 
生成 正确 的 空 指针 值 。 因 此 下 边 的 代码 段 完 全 合法 : 

char *p=0; 

if (p !=0) 

参见 问题 5.3。 

然而 ， 传 入 函数 的 参数 不 一 定 被 当 作 指针 上 下 文 ， 因 而 编译 器 可 能 不 能 识别 
未 加 修饰 的 0 表示 ” 空 指针 。 在 函数 调用 的 上 下 文中 生成 空 指针 需要 显 式 的 类 型 转 
换 ， 强 制 把 0 看 作 指 针 。 例 如 ，UNIX 系 统 调用 execl 接 受 变 长 的 、 以 空 指针 结束 的 
字符 指针 参数 列表 。 它 应 该 如 下 正确 调用 : 

exec! ("/bin/sh", "sh", "-c", "date", (char *)0); 

如 果 省 略 最 后 一 个 参数 的 (char *) 转 换 ， 则 编译 器 无 从 知道 这 是 一 个 空 指针 ， 
从 而 当 作 一 个 整数 0 传 入 。 (注意 很 多 UNIX 手 册 在 这 个 例子 上 都 弄 错 了 。 参 见 问 
题 5.11。 ) 

如 果 作 用 域内 有 函数 原型 ， 则 参数 传递 变 为 "赋值 上 下 文 ?， 从 而 可 以 安全 地 
省 略 很 多 类 型 转换 ， 因 为 原型 告知 编译 器 需要 指针 以 及 需要 的 指针 类 型 ， 使 编译 
器 可 把 未 加 修饰 的 0 正确 转换 为 适当 的 指针 。 函 数 原型 不 能 为 变 长 参数 列表 中 的 
可 变 参 数 提供 类 型 ， 因 而 使 用 可 变 参数 的 时 候 还 是 需要 进行 显 式 的 类 型 转换 ( 参 
见 问题 15.3) 。 在 函数 调用 时 对 所 有 的 空 指 针 进 行 类 型 转换 可 能 是 防止 可 变 参 数 
和 无 原型 函数 出 问题 的 最 安全 的 办 法 。 这 样 可 以 适应 一 些 非 ANSI 的 编译 器 的 要 
求 ， 同 时 表明 你 知道 自己 在 做 什么 。“【 顺 便 提 及 ， 这 个 规则 也 比较 容易 记 住 。) 

下 边 的 总 结 表 明了 什么 时 候 可 以 直接 使 用 空 指针 常量 ， 什 么 时 候 需 要 进行 显 
式 的 类 型 转换 : 


可 以 使 用 未 加 修饰 的 0 需要 显 式 的 类 型 转换 
初始 化 函数 调用 ， 作 用 域内 无 原型 
赋值 变 参 函数 调用 中 的 可 变 参数 


比较 
固定 参数 的 函数 调用 且 在 作用 域内 有 原型 
参考 资料 : [18, Sec. A7.7 p. 190, Sec. A7. 14 p. 192] 
[19, Sec. A7. 10 p. 207, Sec. A7.17 p. 209] 


[8, Sec. ó. 2. 2. 3] 
[11, Sec. 4.6.3 p. 95, Sec. 6.2.7 p.171] 


3.3 


问 : 用 缩写 的 指针 比较 “if(p)” 检 查 空 指针 是 否 有 效 ? 如 果 空 指针 的 内 部 
表达 不 是 0 会 怎样 ? 

答 : 这 样 做 总 是 有 效 的 。 在 C 语 言 中 计算 表达 式 中 的 布尔 值 的 时 候 《在 站 、 
while、for 和 do 表达 式 中 或 者 遇 到 & 上 、||、! 和 ?操作 符 的 时 候 ) ， 如 果 表 达 式 等 
于 0 则 认为 表达 式 为 假 ， 否 则 为 真 。 换 言 之 ， 只 要 写 出 

if (expr) 

无 论 “expr” 是 任何 表达 式 ， 编 译 器 实际 上 都 会 把 它 当 成 

if ((expr) !=0) 

Ab FH 

如 果 用 指针 p 代 蔡 “expr， 则 

if (p) 

等 价 于 

if (p !=0) 

而 这 是 一 个 比较 上 下 文 ， 因 此 编译 器 可 以 看 出 0 实际 上 是 一 个 空 指针 常量 ， 
并 使 用 正确 的 空 指针 值 。 这 里 没有 任何 欺骗 ， 编 译 器 就 是 这 样 工 作 的 ， 并 为 二 者 
生成 完全 一 样 的 代码 。 空 指针 的 内 部 表达 无 关 紧 要 。 

对 布尔 求 反 操作 符 ! 可 如 下 描述 : 


lexpr 

本 质 上 等 价 于 
(expr) ?0:1 

或 者 

( (expr)==0) 

据 此 可 以 得 出 结论 : 
if (!p) 

等 价 于 


if (p==0) 


类 似 if(p) 这 样 的 “缩写 ”尽管 完全 合法 ， 但 却 被 一 些 人 认为 是 不 好 的 风格 ( 男 
外 一 些 人 认为 恰恰 是 好 的 风格 。 参 见 问题 17.10) 。 
参见 问题 9.2。 
参考 资料 : [19, Sec. A7. 4.7 p. 204] 
[8, Sec. ó. 3. 3. 3, Sec. 6. 3.9, Sec. 6. 3. 13, Sec. 6. 3. 14, Sec. 6. 3. 15 
[11, Sec. 5.3.2 p. 122] 


NULL 


为 了 让 程序 中 的 空 指 针 使 用 更 加 明确 ， 特 意 定义 了 一 个 标准 预 处 理 宏 
NULL， 其 值 为 空 指 针 和 常量 。 但 是 ， 多 加 的 这 层 抽象 有 时 候 会 带 来 多 一 层 的 困 
惑 ， 尺 管 它 的 初衷 是 为 了 使 事情 更 清楚 。 


5.4 


问 : NULL 是 什么 ， 它 是 怎么 定义 的 ? 

答 : 作为 一 种 风格 ， 很 多 人 不 愿意 在 程序 中 到 处 出 现 未 加 修饰 的 0， 其 中 一 
些 代 表 数 字 ， 而 另 一 些 代 表 指 针 。 因 此 定义 了 预 处 理 宏 NULL (在 stdio.h 和 其 他 几 
个 头 文件 中 ) 为 空 指针 常量 ， 通 常 是 0 或 者 ((void *)0) (参见 问题 5.6) 。 和 希望 区 分 
整数 0O 和 空 指针 0 的 人 可 以 在 需要 空 指针 的 地 方 使 用 NULL。 

使 用 NULL 只 是 一 种 风格 习惯 ， 预 处 理 器 把 所 有 的 NULL 都 还 原 回 0， 而 编译 
还 是 依照 上 文 的 描述 处 理 指针 上 下 文 的 0。 特 别 地 ， 在 函数 调用 的 参数 里 ，NULL 
之 前 《正如 在 0 之 前 ) 的 类 型 转换 还 是 需要 的 。 问 题 5.2 下 的 表格 对 0 和 NULL 都 有 
效 《〈 未 加 修饰 的 NULL 和 未 加 修饰 的 0 完全 等 价 ) 。 

NULL 只 能 用 作 指 针 。 参 见 问题 5.9。 

参考 资料 : [18,Sec.5.4 pp.97-98] 

[19,Sec.5.4 p.102] 
[8,Sec.7.1.6,Sec.6.2.2.3] 
[14,Sec.4.1.5] 

[11,Sec.5.3.2 p.122,Sec.11.1 p.292] 


5.5 


问 : 在 使 用 非 零 位 模式 作为 空 指针 的 内 部 表示 的 机 器 上 ，NULL 是 如 何 定义 
的 ? 


答 : 跟 其 他 机 器 一 样 : 定义 为 0 或 (void *)0。 参 见 问 题 5.4。 
当 程 序 员 请 求 一 个 空 指针 时 ， 无 论 写 “0” 还 是 “NULL”， 编 译 器 都 会 生成 适合 
机 器 的 空 指 针 的 位 模式 。〔( 而 且 ， 编 译 器 可 以 分 辨 出 指针 上 下 文中 未 加 修饰 的 0 
表示 需要 空 指针 。 参 见 问题 5.12。)〉 因 此， 在 空 指针 的 内 部 表示 不 为 0 的 机 器 上 定 
义 NULL 为 0 跟 在 其 他 机 器 上 一 样 合 法 : 编译 器 在 指针 上 下 文 看 到 的 未 加 修饰 的 0 
都 会 被 生成 正确 的 空 指针 。 常 数 0 是 空 指 针 常 量 ，NULL 仪 仅 是 它 一 个 方便 的 名 
称 。 参 见 问题 5.13。 
C 语 言 标准 的 4.1.5 节 声称 NULL“ 会 被 扩展 为 实现 定义 的 空 指针 常量 ”， 这 意味 
着 实现 会 选择 使 用 哪 种 形式 的 0 并 决定 是 否 使 用 void ”* 强 制 转换 。 参 见 问题 5.6 和 
5.7。 此 处 的 “实现 定义 ”并 不 意味 着 NULL 会 被 定义 成 实现 特有 的 非 零 的 内 部 空 指 
针 值 。 
参见 问题 5.2、5.10 和 5.17。 
参考 资料 : [35, Sec. 4. 1.5] 
[8, Sec. 7.1. 6] 
[14, Sec. 4. 1.5] 


5.6 


问 : 如 果 NULL 定 义 成 #define NULL ((char *)0), PÈT AA AREA RAG 
转换 的 NULL 了 吗 ? 

答 : 一 般 情 况 下 不 行 。 复 杂 之 处 在 于 ， 有 的 机 器 为 不 同类 型 数据 的 指针 使 用 
不 同 的 内 部 表示 。 这 样 的 NULL 定 义 对 于 接受 字符 指针 的 的 函数 没有 问题 ， 但 对 
于 其 他 类 型 的 指针 参数 仍然 需要 进行 显 式 的 类 型 转换 。 而 且 ， 本 来 合法 的 构造 
(如 FILE *fp=NULL;) 可 能 会 失败 。 

Ait, ANSI C 人 允许 NULL 选 择 这 样 的 定义 []; 

#define NULL ((void #) 0) 

除了 有 可 能 帮助 有 错误 的 程序 运行 〈 仅 限于 使 用 同样 类 型 指针 的 机 器 ， 因 此 
帮助 有 限 ) 以 外 ， 这 样 的 定义 还 可 以 发 现 错误 使 用 NULL 的 程序 (例如 ， 在 实际 
需要 使 用 ASCIINUL 字 符 的 地 方 ， 参 见 问 题 5.9) 。 参 见 问题 5.7。 

习惯 于 现代 的 、“ 和 平面? 内 存 架 构 的 程序 员 很 难 理解 “不 同类 型 的 指针 ?这 样 的 
概念 。 问 题 5.17 中 有 相关 的 例子 。 


参考 资料 : [14,Sec.4.1.5] 


Vd 


NI 


问 : 我 的 编译 器 提供 的 头 文件 中 定义 的 NULL 为 0L。 为 什么 ? 

答 : 有 些 程 序 粗心 大 意 地 在 非 指 针 上 下 文中 不 经 类 型 转换 就 直接 使 用 NULL 
宏 ， 试 图 生成 空 指 针 。 这样 做 不 一 定 能 工作 ， 参 见 问题 5.2 和 5.11。) 在 指针 比 
整 型 大 的 机 器 上 《例如 处 于 “large” 模 式 的 PC 兼容 机 上 。 人 参见 问题 5.17) 使 用 0L 这 
样 特殊 的 NULL 定 义 能 使 这 些 错 误 的 程序 工作 。 

(0OL 是 个 绝对 合法 的 NULL 定 义 ， 它 是 “一 个 值 为 0 的 整 型 常量 表达 式 ”。) 让 
错误 的 程序 运行 是 否 明智 是 件 有 和 争议 的 事情 。 参 见 问 题 5.6 和 第 17 章 。 

参考 资料 : [14, Sec. 4. 1.5] 

[11, Sec. 5. 3. 2 pp. 121-122] 


~ 


5.8 


问 : NULL AA Ae FE BRIBE ? 
答 : 是 的 。 (参见 问题 4.13。) 
参考 资料 : [35, Sec. 3. 2. 2. 3] 

[8, Sec. 6.2.2.3] 


5.9 


问 : 如 果 NULL 和 0 作为 空 指针 常量 是 等 价 的 ， 那 我 到 底 该 用 哪 一 个 呢 ? 

答 : 许多 程序 员 认 为 在 所 有 的 指针 上 下 文中 都 应 该 使 用 NULL， 以 表明 该 值 
应 该 被 看 作 指 针 。 另 一 些 人 则 认为 用 一 个 宏 来 定义 0， 只 不 过 把 事情 搞 得 更 复 
杂 ， 反 而 令 人 困惑 ， 因 而 倾向 于 使 用 未 加 修饰 的 0。 没 有 正确 答案 。 (参见 问题 
9.2 和 17.10) C 程 序 员 应 该 明白 ， 在 指针 上 下 文中 NULL 和 0 是 完全 等 价 的 ， 而 未 加 
修饰 的 0 也 完全 可 以 接受 。 任 何 使 用 NULL 〈 跟 0 相对 ) 的 地 方 都 应 该 看 作 一 种 温 
和 的 提示 : 是 在 使 用 指针 ， 程 序 员 〈 和 编译 器 都 ) 不 能 依靠 它 来 区 别 指针 0 和 整 
数 0。 


在 需要 其 他 类 型 的 0 的 时 候 ， 即 便 它 可 能 工作 也 不 能 使 用 NULL， 因 为 这 样 做 
发 出 了 错误 的 格式 信息 。 【而且 ，ANSI 人 允许 把 NULL 定 义 为 ((void *)0)， 这 在 非 指 
针 的 上 下 文中 将 不 能 工作 。 特 别 是 ， 不 能 在 需要 ASCII 空 字符 (NUL) 的 地 方 用 
NULL。 如 果 有 必要 ， 提 供 你 自己 的 定义 : 

#define NUL '\0' 

参考 资料 : [18, Sec. 5.4 pp. 97-98] 

[19, Sec. 5.4 p. 102] 


gi 
Ep 
© 


问 : 但 是 如 果 NULL 的 值 改 变 了 ， 比 如 在 使 用 非 零 内 部 空 指针 的 机 器 上 ， 用 
NULL (而 不 是 0) 不 是 更 好 吗 ? 

答 : 不 。〔 用 NULL 可 能 更 好 ， 但 不 是 这 个 原因 。)〉 RE SHEA NGS 
数字 使 用 以 备 数字 的 改变 ， 但 这 不 是 用 NULL 代 蔡 0 的 原因 。C 语 言 本 身 确保 了 源 
码 中 的 0〈 用 于 指针 上 下 文 ) 会 生成 空 指针 。NULL 只 是 用 作 一 种 格式 习惯 。 参 见 
问题 5.5 和 9.2。 


gi 
pe 
j= 


问 : 我 曾经 使 用 过 一 个 编译 器 ， 不 使 用 NULL 就 不 能 编译 。 

答 : 如 果 不 是 编译 的 程序 不 可 移植 ， 束 可 能 是 编译 器 坏 了 。 可 能 代码 中 使 用 
了 类 似 问 题 5.2 中 错误 例子 的 东西 : 

exec! ("/bin/sh", "sh", "-c", "date", NULL) ; /* WRONG */ 

如 果 编 译 器 把 NULL 定 义 为 ((void *)0)《〈 人 参见 问题 5.6) ， 则 这 个 代码 可 以 编译 
[1]。 可 是 ， 如 果 指 针 和 整数 的 大 小 或 表示 不 一 样 ， 则 下 边 〈 同 样 错 误 ) 的 代码 可 
能 就 不 行 了 : 

exec! ("/bin/sh", "sh", "-c", "date",0); / *WRONG* / 

可 移植 的 代码 需要 使 用 显 式 的 类 型 转换 : 

exec! ("/bin/sh", "sh", "-c", "date", (char *) NULL) ; 

使 用 这 样 的 类 型 转换 以 后 ， 无 论 机 器 的 整数 和 指针 表示 是 否 相 同 ， 也 无 论 编 
译 器 选择 哪 种 形式 的 NULL 定 义 ， 这 个 代码 总 能 正确 工作 。【〔 问 题 5.2 中 使 用 0 代 蔡 


NULEL 的 代码 片段 ， 同 样 是 正确 的 。 参 见 问题 5.9。 


5.12 


H: 我 用 预 处 理 宏 #define Nullptr (type) (type *)0 帮 助 创建 正确 类 型 的 空 
指针 。 

答 : 这 种 技巧 ， 尽 管 很 流行 而 且 表面 上 看 起 来 很 有 吸引 力 ， 但 却 没 有 多 少 意 
义 。 在 赋值 和 比较 时 并 不 需要 它 ， 参 见 问题 5.2。 它 甚至 都 不 能 节省 键盘 和 输入。 使 
用 这 个 东西 往往 表明 程序 的 作者 对 空 指针 的 问题 并 不 十 分 清楚 ， 可 能 需要 对 这 个 
宏 的 定义 、 调 用 和 其 他 所 有 的 指针 使 用 仔细 检查 一 下 。 参 见 问题 9.1 和 10.2。 


回顾 


在 有 些 圈子 中 ， 对 空 指针 的 误解 十 


这 5 个 问题 探讨 了 部 分 原因 


.1 


es) 


H: 这 有 点 奇怪 : NULL 可 以 确保 是 0， 但 室 (null) 指针 却 不 一 定 ? 
答 : 随便 使 用 术语 “null” 或 *NULL2? 时 ， 可 


ab =e. 


能 意味 着 以 下 一 种 或 几 种 含义 。 
(概念 上 的 空 指针 ， 问 题 5.1 定 义 的 抽象 语言 概念 。 它 古 使 用 以 下 的 东西 实现 
Hl cos 


(2) 空 指针 的 内 部 《或 运行 时 ) 表示 形式 ， 这 可 能 并 不 是 全 零 ， 而 且 对 不 同 的 
指针 类 型 可 能 不 一 样 。 真 正 的 值 只 有 编译 器 开发 者 才 关 心 。C 程 序 的 作者 永远 看 
不 到 它们 ， 因 为 他 们 使 用 .……. 


(3) 空 指针 常量 ， 这 是 一 个 常 整数 0[3]〈 参 见 问题 5.2〉 。 它 通常 隐藏 在 .……… 
(4)NULL 宏 后 边 ， 它 被 定义 为 0〈 参 见 问 题 5.4) 。 最 后 转移 我 们 的 注意 力 


(5)ASCII 空 字符 (NUL) ， 它 的 确 是 全 零 ， 但 它 和 空 指针 除了 在 名 称 上 相似 
以 外 ， 没 有 任何 必然 关系 。 而 


(6)“ 空 串 ”Cnull 


string) ， 它 是 内 容 为 空 的 字符 串 〈") 。 在 C 中 使 用 空 串 这 
个 术语 可 能 令 人 困惑 ， 因 为 空 串 包括 空 字符 (\0') ， 但 不 包括 空 指针 ， 这 让 我 们 
JÙ 


换言之 ， 正 如 White Knight 在 Through the Looking-Glass CAH T) 中 描述 
他 的 歌 一 样 ， 空 指针 的 名 称 是 “0”， 但 空 指针 的 名 称 却 被 叫做 “NULL”( 而 我 们 并 
不 知道 空 指针 到 底 是 什么 ) 。 


本 文 用 词语 “ 空 指针 ”(“null pointer”， 小 写 ) 表示 第 


语 “ 空 指针 常量 ” 


种 含义 ， 字 符 “0? 或 词 
表示 第 三 种 含义 ， 用 大 写 NULL 表 示 第 四 种 含义 。[4] 
参考 资料 : [11, Sec. 1.3 p. 325] 


[5, Chapter VIII] 


5.14 


问 : 为 什么 有 那么 多 关于 空 指针 的 疑惑 ? 为 什么 这 些 问 题 如 此 频繁 地 出 现 ? 

答 : C 程 序 员 传统 上 喜欢 知道 很 多 (可 能 比 他 们 需要 知道 的 还 要 多 ) 关于 机 
器 实现 的 细节 。 空 指针 在 源码 和 大 多 数 机 器 实现 中 都 用 零 来 表示 的 事实 导致 了 很 
多 无 根据 的 猜测 。 而 预 处 理 宏 NULL) 的 使 用 又 似乎 在 暗示 这 个 值 可 能 会 在 某 
个 时 刻 或 者 在 某 种 怪异 的 机 器 上 改变 。*if(p==0)” 这 种 结构 又 很 容易 被 误 认 为 在 比 
较 之 前 把 p 转 成 了 整数 类 型 ， 而 不 是 把 0 转 成 了 指针 类 型 。 最 后 ， 术 语 “ 空 ”的 几 种 
用 法 (如 上 文 问题 5.13 所 列 出 的 ) 之 间 的 区 别 又 可 能 被 忽视 。 

冲 出 这 些 迷 帆 的 一 个 好 办 法 ， 是 想象 C 使 用 一 个 关键 字 (或 许 像 Pascal 那 样 ， 
Hi) 作为 空 指针 常量 。 编 译 器 要 么 在 源 代码 没有 歧义 的 时 候 把 “nil* 转 成 适当 
类 型 的 空 指 针 ， 要 么 在 有 歧义 的 时 候 发 出 提示 。 现 在 ， 事 实 上 C 语 言 的 空 指针 常 
量 关 键 字 不 是 “nil* 而 是 “0”"， 这 在 多 数 情况 下 都 能 正常 工作 ， 除 了 一 个 未 加 修饰 
的 “0? 用 在 非 指针 上 下 文 的 时 候 ， 编 译 器 把 它 生成 整数 0 而 不 是 发 出 错误 信息 。 如 
果 那 个 未 加 修饰 的 0 应 该 是 空 指针 常量 ， 那 么 生成 的 程序 可 能 不 能 工作 。 


5.15 


问 : 有 没有 什么 简单 点 儿 的 办 法 理解 所 有 这 些 与 空 指针 有 关 的 东西 呢 ? 

答 : 有 两 条 简单 规则 你 必须 遵循 : 

(1) 当 在 源码 中 需要 空 指针 常量 时 ， 用 “0” 或 “NULL”; 

(2) 如 果 在 函数 调用 中 “0” 或 “NULL” 用 作 参 数 ， 把 它 转 换 成 被 调 函 数 需 要 的 指 
针 类 型 。 

本 章 的 其 他 内 容 是 关于 其 他 人 的 误解 、 空 指针 的 内 部 表示 (这 你 无 需 了 解 ) 
和 函数 原型 的 复杂 性 的 。 (考虑 到 这 些 复杂 性 ， 我 们 发 现 规则 (2) 有 些 保守 ， 
但 它 没 什么 害处 。) 理解 问题 5.1、5.2 和 5.4， 考 虑 问题 5.3、5.9、5.13 和 5.14， 你 
就 会 变 得 清晰 。 


5.1 


问 : 考虑 到 有 关 空 指针 的 所 有 这 些 困 惑 ， 要 求 它 们 的 内 部 表示 都 必须 为 0 不 


是 更 简单 吗 ? 

答 : 某 些 实现 很 自然 地 用 特殊 的 非 零 值 表示 空 指 针 ， 尤 其 是 当 它 可 以 用 这 样 
的 特殊 值 来 触发 自动 的 硬件 陷阱 的 时 候 。 强 制 要 求 用 0 来 表示 空 指针 一 -从 而 阻止 
它们 用 特殊 的 非 全 零 值 表示 空 指针 一 -会 成 为 一 种 不 幸 的 倒退 ， 因 为 捕 提 到 导致 
非法 访问 的 错误 毕竟 是 一 件 好 事 。 

另外 ， 这 样 的 要 求 真正 能 完成 什么 呢 ? 对 空 指 针 的 正确 理解 不 需要 内 部 表示 
的 知识 ， 无 论 是 零 还 是 非 零 。 假 设 空 指针 内 部 表示 为 零 并 不 会 使 任何 代码 的 编写 
更 容易 《除了 一 些 不 动脑 筋 的 calloc 调 用 ， 参 见 问 题 7.35) 。 用 零 作 空 指针 的 内 部 
表示 也 不 能 消除 在 函数 调用 时 的 类 型 转换 ， 因 为 指针 的 大 小 可 能 和 int 型 的 大 小 依 
然 不 同 。《 如 果 像 问题 5.14 所 述 ， 用 “ip 来 请 求 空 指针 ， 则 用 0 作 空 指针 的 内 部 表 
达 的 想法 都 不 会 出 现 。 ) 


5.17 


问 : 说 真 的 ， 真 有 机 器 用 非 零 空 指针 吗 ， 或 者 不 同类 型 用 不 同 的 表示 ? 

Æ. 至 少 PL/[、Prime50 系 列 用 段 07777、 偏 移 量 0 作为 空 指针 。 后 来 的 型 号 使 
用 段 0、 偏 移 量 0 作 为 C 的 空 指 针 ， 和 迫使 类 似 TCNP (Test C Null Pointer， 测 试 C 空 
KED 的 新 指令 明显 成 了 现成 的 、 作 出 错误 猜想 的 整 脚 C 代 码 。 按 字 寻 址 的 旧 
Prime 机 器 同样 因为 要 求 字 节 指 针 Cchar *) 比 字 指针 (int*) 更 长 而 声名 狼藉 。 

Data “General 的 Eclipse  MV 系 列 支 持 3 种 结构 的 指针 格式 〈 字 、 字 节 和 位 指 
针 ) ，C 编 译 器 使 用 了 其 中 两 种 : char * 和 void * 使 用 字 节 指针 ， 而 其 他 的 使 用 字 
指针 。 

某 些 Honeywell-Bull 大 型 机 使 用 位 模式 06000 作 为 〈 内 部 的 ) 空 指针 。 

CDC Cyber 180 系 列 使 用 包含 环 (ring) 、 段 和 偏 移 量 的 48 位 指针 。 多 数 用 户 
(在 环 11 上 ) 使 用 的 空 指针 为 0xB00000000000。 在 旧 的 1 次 补 码 的 CDC 机 器 上 用 
全 1 表示 各 种 数据 的 特殊 标志 【包括 非法 地 址 ) 是 十 分 常见 的 事情 。 

旧 的 HP ”3000 系 列 对 字 节 地 址 和 字 地 址 使 用 不 同 的 寻 址 模式 。 正 如 上 面 的 机 
器 一 样 ， 因 此 它 也 使 用 不 同 的 形式 表达 char * 和 void * 型 指针 及 其 他 指针 。 

Symbolics Lisp 机 器 是 一 种 标签 结构 ， 它 甚至 没有 传统 的 数值 指针 。 它 使 用 去 
NIL,0 二 对 (通常 是 不 存在 的 二 对 象 ， 偏 移 二 句柄 作为 C 空 指针 。 

根据 使 用 的 “内 存 模式 ”，8086 系 列 处 理 器 (PC 兼容 机 ) 可 能 使 用 16 位 的 数据 


指针 和 32 位 的 函数 指针 ， 或 者 相反 。 

一 些 64 位 的 Cray 机 器 在 一 个 字 的 低 48 位 表示 int *, char * 使 用 高 16 位 的 某 些 位 
表示 一 个 字 节 在 一 个 字 中 的 地 址 。 

参考 资料 : [18, Sec. A14. 4 p.211] 


地 址 0 上 到 底 有 什么 ? 


不 能 将 空 指针 看 作 指 向 地 址 0 的 指针 。 但 是 如 果 你 访问 地 址 0 (无 论 有 意 还 是 
无 意 ) ， 就 需要 考虑 空 指针 的 影响 了 。 


gi 
ps 
co 


问 : 运行 时 的 整数 值 0 转换 为 指针 以 后 一 定 是 空 指 针 吗 ? 
EB: 不 。 只 有 常量 整 型 表达 式 0 才 能 保证 表示 空 指针 。 人 参见 问题 4.14、5.2 和 


gi 
j 
(© 


问 : 如 何 访问 位 于 机 器 地 址 0 处 的 中 断 向 量 ? 如 果 我 将 指针 值 设 为 0， 编 译 器 
可 能 会 自动 将 它 转换 为 非 零 的 空 指针 内 部 表示 。 

答 : 因为 ， 不 管 位 置 0 上 有 什么 内 容 都 是 跟 机 器 相关 的 ， 你 可 以 自由 地 使 用 
机 器 提供 的 任何 技巧 访问 这 个 位 置 。 阅 读 你 的 广 丙 文 要 《〈 和 第 19 章 ) 。 如 果 访 问 
地 址 0 真 的 有 意义 ， 很 可 能 系统 会 被 设置 成 能 相当 方便 地 访问 它 。 以 下 是 茶 些 可 


能 的 方法 。 
简单 地 给 指针 赋 0 值 。《〈 这 种 方法 不 一 定 有 效 ， 但 如 果 它 有 意义 ， 则 有 可 能 
有 效 。) 


将 整数 0 赋 给 一 个 int 型 变量 ， 然 后 将 int 变 量 转换 为 指针 。 (这 样 也 不 一 定 有 
效 ， 但 也 可 能 有 效 。) 
用 一 个 联合 将 指针 值 的 位 都 置 为 0: 
union { 
int *u_p; 
int u_i; /* assumes sizeof (int) >=sizeof (int *) */ 


} p; 


p. u_i=0; 
使 用 memset 将 指针 变量 的 所 有 位 都 置 为 0: 
memset ( (void *) &p, 0, sizeof (p) ) ;声明 一 个 外 部 变量 或 数组 : 
extern int location0; 
然后 用 汇编 语言 或 特殊 的 连接 器 调用 使 这 个 符号 指向 《〈 即 把 这 个 变量 放 在 ) 
地 址 0。 
参见 问题 4.14 和 问题 19.30。 
参考 资料 : [18, Sec. A14. 4 p. 210] 
[19, Sec. A6.6 p. 199] 
[35, Sec. 3.3.4 ] 
[8, Sec. 6. 3. 4] 
[14, Sec. 3. 3. 4] 
[11, Sec. 6.2.7 pp. 171-172] 


.20 


问 : 运行 时 的 “nul| pointer assignment” 错 误 是 什么 意思 ? 应 该 怎样 捕 
RE? 

答 : 这 个 信息 通常 由 MS-DOS 编 译 器 《因此 参见 第 19 章 ) 发 出 ， 表 明 你 通过 
空 指针 向 地 址 0《〈 可 能 是 指针 未 初始 化 ) 写 入 了 数据 。 参 见 问题 16.9。 

调试 器 可 能 允许 你 在 地 址 0 设置 数据 断 点 或 观察 点 或 其 他 东西 。 或 者 ， 你 也 
可 以 写 一 段 代 码 复制 出 从 地 址 0 开始 的 20 个 字 节 左右 的 内 容 ， 然 后 定期 检查 其 内 
容 是 否 改 变 。 


[11. 因 为 void * 指 针 的 特殊 赋值 属性 ， 当 NULL 定 义 为 ((void *)0) 时 ， 初 始 化 FILE 
*fp=NULL; 是 合法 的 。 


[21 在 NULL 的 伪装 下 ， 使 用 (void *)0 而 不 是 (char :0 夺 巧 可 以 仅仅 是 因为 可 以 保证 
void * 和 char * 指 针 的 相互 转换 。 


[B31 更 准确 地 讲 ， 空 指针 常量 是 一 个 值 为 0 的 整 型 常量 表达 式 ， 可 能 被 转换 成 了 


void * 类 型 。 


[和 非常 严 格 地 讲 ， 作 为 名 词 的 “ 空 ”只 表示 第 五 种 合 义 ， 而 “NULL” 仪 表示 第 四 种 


含义 ; 其 他 情况 下 的 “ 空 ”都 是 形容 词 ， 正 如 在 (不 相关 的 )“ 空 语句 ”中 一 样 。 这 
都 是 公认 的 精 雕 细 琢 。 


第 6 章 数组 和 指针 


数组 和 指针 的 统一 性 是 C 语 言 的 长 处 之 一 。 用 指针 可 以 很 方便 地 访问 数组 和 
模拟 动态 分 配 的 数组 。 然而， 由 于 数组 和 指针 的 所 谓 等 价 性 非常 接近 ， 甚 至 程序 
员 有 时 忽视 了 二 者 之 间 的 其 他 重要 区 别 ， 盲 目地 认为 它们 完全 相同 或 者 想当然 地 
腾 造 出 各 种 莞 座 的 相似 性 和 共同 点 。 

正如 问题 6.3 所 述 ， 多 数 的 数组 引用 都 会 退化 为 数组 第 一 个 元 素 的 指针 ， 这 是 
C 语 言 中 数组 和 指针 “等 价 ” 的 基础 。 因 此 ， 数 组 在 C 语 言 中 是 个 “二 等 公民 ”你 水 
远 也 不 能 作为 一 个 整体 操作 数组 (例如 ， 复 制 或 将 它们 传 入 函数 ) ， 因 为 一 旦 你 
提 到 数组 的 名 字 ， 你 所 得 到 的 就 是 一 个 指针 而 不 是 整个 数组 了 。 因 为 数组 退化 为 
指针 ， 数 组 的 下 标 操作 符 [] 总 能 通过 对 指针 的 操作 顺 次 找到 自己。 事实 上 ， 下 标 
表达 式 a[j] 就 是 按照 等 价 的 指针 表达 式 *((a)+GD) 定 义 的 。 

本 章 的 部 分 内 容 (尤其 是 “回顾 ”部 分 的 问题 6.8 到 6.10)〉 可 能 看 起 来 有 些 多 
余 ， 但 人 们 对 数组 和 指针 有 诸多 困惑 ， 而 这 一 章 希 望 尽 其 所 能 把 相关 的 问题 都 搞 
清楚 。 如 果 你 对 这 些 重复 的 话题 感到 大 烦 ， 直 接 跳 过 即 可 。 但 如 果 你 还 弄 不 清 
楚 ， 就 要 读 个 明白 。 


数组 和 和 指针 的 基本 关系 


6.1 


H: 我 在 一 个 源 文 件 中 定义 了 char a[6] ， 在 另 一 个 源 文件 中 声明 了 extern 
char #a。 为 什么 不 行 ? 

答 : 你 在 一 个 源 文件 中 定义 了 一 个 字符 串 ， 而 在 另 一 个 文件 中 定义 了 指向 字 
符 的 指针 。Extern char * 的 声明 不 能 和 真正 的 定义 匹配 。 类 型 T 的 指针 和 类 型 工 的 
数组 并 非 同 种 类 型 。 请 使 用 extern char af]. 

参考 资料 : [35, Sec. 3. 5. 4. 2] 

[8, Sec. 6. 5. 4. 2] 
[22, Sec. 3.3 pp. 33-34, Sec. 4.5 pp. 64-65] 


6.2 


H: 可 是 我 听 说 char all fechar *a 是 等 价 的 。 是 这 样 的 吗 ? 

答 : 完全 不 是 。【〈 你 所 听 说 的 应 该 跟 函 数 的 形 参 有 关 ， 人 参见 问 题 6.4) 数组 不 
是 指针 。 数 组 定义 char a[6] 请 求 预 留 6 个 字符 的 位 置 ， 并 用 名 称 a 表 示 。 也 就 是 
说 ， 有 一 个 称 为 “a” 的 位 置 ， 可 以 放 入 6 个 字符 。 而 指针 声明 char*p 请 求 一 个 位 置 
放置 一 个 指针 ， 用 名 称 “p” 表 示 。 这 个 指针 几乎 可 以 指 疝 任 何 位 置 任何 字符 或 任 
何 连 续 的 字符 ， 或 者 哪里 也 不 指 [11 (参见 问题 5.1 和 1.31)〉。 

一 个 图 形 胜 过 千言 万 语 。 声 明 

char a[]="hello"; 


char *p="world"; 


将 会 初始 化 下 图 所 示 的 数据 结 


a: [n fe [1] 1 Jo ho] 


p: | =w |o r}ild ho 


根据 x 是 数组 还 是 指针 ， 像 x[3] 这 样 的 引用 会 生成 不 同 的 代码 。 认 识 到 这 一 点 
大 有 神 益 。 以 上 面 的 声明 为 例 ， 当 编译 器 看 到 表达 式 a[3] 的 时 候 ， 它 生成 的 代码 
从 a 的 位 置 开始 跳 过 3 个 ， 然 后 取出 那个 字符 。 如 果 它 看 到 p[3]， 它 生成 的 代码 找 
到 p 的 位 置 ， 取 出 其 中 的 指针 值 ， 在 指针 上 加 3 然后 取出 指向 的 字符 。 换 言 之 ， 
af[3] 是 名 为 a 的 对 象 〈 的 起 始 位 置 ) 之 后 3 个 位 置 的 值 ， 而 p[3] 是 p 指 向 的 对 象 的 3 个 
位 置 之 后 的 值 。 在 上 例 中 ，a[3] 和 p[3] 碰 巧 都 是 字符 TT， 但 是 编译 器 到 达 那 里 的 途 
径 不 尽 相 同 。 本 质 的 区 别 在 于 类 似 a 的 数组 和 类 似 p 的 指针 一 旦 在 表达 式 中 出 现 就 
会 按照 不 同 的 方法 计算 ， 不 论 它 们 是 否 有 下 标 。 下 一 问题 继续 深入 解释 。 参 见 问 
题 1.34。 

参考 资料 : [19, Sec. 5.5 p. 104] 

[22, Sec. 4.5 pp. 64-65] 


6.3 


问 : 那么 ， 在 0 语言 中 “指针 和 数组 等 价 ” 到 底 是 什么 意思 ? 

答 : 在 C 语 言 中 对 数组 和 指针 的 困惑 多 数 都 来 自 这 人 句 话 。 说 数组 和 指针 “等 
价 ” 不 表示 它们 相同 ， 甚 至 也 不 能 互 换 。 它 的 意思 是 说 数组 和 指针 的 算法 定义 使 得 
可 以 用 指针 方便 地 访问 数组 或 者 模拟 数组 。 换 言 之 ， 正 如 Wayne Throop 指 出 
的 , “在 C 语 言 中 只 是 指针 算术 和 数组 下 标 运算 等 价 ， 指 针 和 数组 是 不 同 的 。” 

特别 地 ， 等 价 的 基础 来 自 这 个 关键 定义 : 

一 个 T 数 组 类 型 的 对 象 如 果 出 现在 表达 式 中 会 退化 为 一 个 指向 数组 第 一 个 元 
素 的 指针 (有 3 种 例外 情况 ) ， 指 针 的 类 型 是 指向 T 的 指针 。 

这 就 是 说 ,一旦 数组 出 现在 表达 式 中 ， 编 译 占 会 隐 式 地 生成 一 个 指向 数组 第 
一 个 元 素 的 指针 ， 就 像 程序 员 写 出 了 &af[0] 一 样 。 当 数组 作为 sizeof 或 区 操作 符 的 
操作 数 ， 或 者 作为 字符 数组 的 字符 串 初始 值 的 时 候 例 外 。 

由 于 这 个 定义 ， 尽 管 数 组 和 指针 有 很 大 区 别 ， 编 译 器 并 不 那么 严格 区 分 数组 
下 标 操作 符 品 作用 于 数组 和 指针 的 不 同 。 在 形 如 af 的 表达 式 中 ， 根 据 上 边 的 规 
则 ， 数 组 退化 为 指针 然后 按照 指针 变量 的 方式 如 p[j] 那 样 寻 址 《但 是 最 终 的 内 存 访 
问 并 不 一 样 ， 如 问题 6.2 所 述 ) 。 如 果 你 把 数组 地 址 赋 给 指针 : 

p=a; 


那么 p[3] 和 a[3] 将 会 访问 同样 的 元 素 。 


这 种 和 谐 的 访问 解释 了 指针 如 何 访问 数组 、 如 何 奉 代数 组 作为 函数 参数 CS 
见 问题 6.4) 以 及 如 何 模拟 动态 数组 〈 参 见 问题 6.14) 。 参 见 问题 6.8 和 6.14。 
参考 资料 : [18, Sec. 5. 3 pp. 93-96] 
[19, Sec. 5. 3 p.99] 
[8, Sec. 6.2.2.1, Sec. 6.3.2.1, Sec. 6. 3. 6] 
[11, Sec. 5.4.1 p. 124] 


6.4 


问 : 既然 它们 这 么 不 同 ， 那 为 什么 作为 函数 形 参 的 数组 和 指针 声明 可 以 互 换 
呢 ? 答 : 这 是 一 种 便利 的 做 法 。 

由 于 数组 会 马上 退化 为 指针 ， 数 组 事实 上 从 来 没有 被 传 入 到 函数 。 人 允许 指针 
参数 声明 为 数组 只 不 过 是 为 让 它 看 起 来 好 像 传 入 了 数组 ， 因 为 该 参数 可 能 在 函数 
内 当 作 数组 使 用 。 具 体 来 说 ， 任 何 声明 “看 起 来 像 ?数组 的 参数 ， 例 如 

void f (char a[]) 

ET 

在 编译 器 里 都 被 当 作 指针 来 处 理 ， 因 为 在 传 入 数组 的 时 候 ， 函 数 接收 到 的 正 
是 指针 。 

void f(char *a) 

{ acd 

如 采 函 数 本 来 就 是 用 来 操作 数组 的 ， 或 者 参数 在 函数 内 部 当 作 数组 来 使 用 
的 ， 那 么 声称 函数 接收 数组 没有 什么 不 受 。 

这 种 转换 仅 限 于 函数 形 参 的 声明 ， 别 的 地 方 并 不 适用 。 如 果 这 种 转换 令 你 困 
惑 ， 请 避免 它 。 很 多 程序 员 得 出 结论 ， 让 形 参 声明 “看 上 去 像 ” 函 数 的 调用 形式 或 
函数 内 部 的 用 法 所 禹 来 的 困惑 远 远大 于 它 所 提供 的 小 小 方便 。〔 注 意 这 种 转换 只 
能 发 生 一 次 ，a2[][0] 这 样 的 代码 是 不 行 的 。 参 见 问题 6.18 和 6.19。) 

参见 问题 6.21。 

参考 资料 : [18, Sec. 5. 3 p. 95, Sec. A10. 1 p.205] 

[19, Sec. 5.3 p. 100, Sec. A8. 6. 3 p. 218, Sec. A10. 1 p. 226] 
[8, Sec. 6.5.4. 3, Sec. 6. 7. 1, Sec. 6.9. 6] 
[11, Sec. 9.3 p. 271] 


[22, Sec. 3.3 pp. 33-34] 


数组 不 能 被 赋值 


如 果 数 组 出 现在 赋值 的 右边 ， 则 只 有 它 所 退化 的 指针 被 复制 ， 而 不 是 整个 数 
组 。 男 外 ， 数 组 不 能 出 现在 赋值 的 左 侧 〈 部 分 原因 在 于 ， 如 上 句 话 所 说 ， 永 远 也 
不 会 有 一 个 完整 的 数组 让 它 接收 〉。 


6.5 


问 : 为 什么 不 能 这 样 向 数组 赋值 ? 

extern char *getpass () ; 

char str[10]; 

str=getpass ("Enter password:"); 

答 : 数组 在 C 语 言 中 是 “二 等 公民 ”。 这 导致 后 果 之 一 就 是 你 不 能 回 它 赋值 
《参见 问题 6.7) 。 当 你 需要 从 一 个 数组 向 另 一 个 数组 复制 所 有 的 内 容 的 时 候 ， 你 
必须 明白 无 误 地 这 样 做 。 对 于 char 型 数组 ， 使 用 strcpy 通 常 是 最 恰当 的 : 

strcpy(str,getpass(""Enter password: ")); 

如 果 你 不 想 复制 数组 而 希望 传递 它们 ， 可 以 使 用 指针 直接 赋值 。 参 见 问题 4.1 
和 8.2。 

参考 资料 : [35, Sec. 3. 2. 2. 1] 

[8, Sec. 6.2.2.1] 
[11, Sec. 7.9.1 pp. 221-222] 


6.6 


问 : 既然 不 能 向 数组 赋值 ， 那 这 段 代 码 为 什么 可 以 呢 ? 
int f(char str[]) 
{ 

if (str [0]=='\0') 


str="none" ; 


} 
SB: 在 这 段 代码 中 ，str 是 个 函数 参数 ， 如 问题 6.4 所 述 ， 它 的 声明 被 编译 器 重 


ee 


写 了 。 换 言 之 ，str 是 个 (char * 型 ) 指针 ， 因 此 向 它 赋值 完全 合法 。 
6.7 


问 : 如 果 你 不 能 给 它 赋值 ， 那 么 数组 如 何 能 成 为 左 值 呢 ? 

答 : 术语 “ 左 值 ”* 并 不 完全 表示 “能 赋值 的 东西 "。 更 好 的 定义 应 该 是 “(在 内 存 
H) 有 特定 位 置 的 东西 ”2]。ANSI C 标 准 定 义 了 “可 修改 的 左 值 "”， 但 数组 不 是 。 
参见 问题 6.5。 

参考 资料 : [35, Sec. 3. 2. 2.1] 

[8, Sec. 6.2.2.1] 
[14,Sec.3.2.2.1] 
[11,Sec.7.1 p.179] 


回顾 


因为 数组 和 指针 的 基本 关系 有 时 引发 那么 多 的 困惑 ， 所 以 这 里 列举 了 一 些 有 
关 这 些 困惑 的 问题 。 


6.8 


P: 现实 地 讲 ， 数 组 和 指针 的 区 别 是 什么 ? 

答 : 数组 是 一 个 由 《同一 类 型 的 ) 连续 元 素 组 成 的 预先 分 配 的 内 存 块 。 指 针 
是 一 个 对 任何 位 置 的 (特定 类 型 的 ) 数据 元 素 的 引用 。 

数组 自动 分 配 空间 ， 但 是 不 能 重 分 配 或 改变 大 小 。 指 针 必须 被 赋值 以 指 辣 分 
配 的 空间 〈 可 能 使 用 malloc) ， 但 是 可 以 随意 重新 赋值 〈《 即 指向 不 同 的 对 象 ) ， 
同时 除了 表示 一 个 内 存 块 的 基 址 之 外 ， 还 有 许多 其 他 的 用 途 。 (参见 问题 4.1。) 

由 于 数组 和 指针 所 谓 的 等 价 性 《参见 问题 63) ， 数 组 和 指针 经 常 看 起 来 可 以 
互 换 ， 而 事实 上 指向 malloc 分 配 的 内 存 块 的 指针 通常 被 看 作 一 个 真正 的 数组 〈 也 
可 以 用 [引用 〉 。 参 见 问 题 6.14 和 6.16。 (但 是 ， 要 小 心 sizeof 的 使 用 。 参 见 问题 
7.32) 。 

参见 问题 1.34、6.10 和 20.15。 


6.9 


H: 有 人 跟 我 讲 ， 数 组 不 过 是 常 指针 。 这 样 讲 准确 吗 ? 
答 : 这 有 些 过 度 简 化 了 。 数 组 名 之 所 以 为 “常量 * 是 因为 它 不 能 被 赋值 ， 但 是 
数组 不 是 指针 ， 问 题 6.2 的 讨论 和 图 可 以 说 明 这 一 点 。 参 见 问题 6.3、6.8 和 6.10。 


6.10 


问 : 我 还 是 很 困惑 。 到 底 指 针 是 一 种 数组 ， 还 是 数组 是 一 种 指针 ? 


答 : 数组 不 是 指针 ， 反 之 亦 然 。 对 数组 的 引用 (就 是 说 ， 在 求 值 上 下 文中 对 
数组 的 任何 提 及 ) 会 变 成 指针 (参见 问题 6.2 和 6.3。) 

有 3 种 想法 是 正确 的 : 

(1) 指 针 可 以 模拟 数组 (但 这 还 不 是 全 部 ， 参 见 问题 4.1); 

(2) 几 乎 没有 所 谓 数组 的 东西 〈 不 管 怎 么 说 ， 它 毕竟 是 个 “二 等 公民 ”) ， 下 标 
操作 符 口 实际 上 是 个 指针 操作 符 ; 

(3) 从 更 高 的 抽象 层次 来 看 ， 指 向 一 块 内 存 的 指针 本 质 上 也 就 是 一 个 数组 〈 当 
然 这 并 没有 涉及 指针 的 其 他 用 途 ) 。 

需要 重申 的 是 ， 有 两 种 想法 是 不 对 的 : 

(4)“ 它 们 完全 是 一 样 的 "，“【〔 错 ， 参 见 问题 6.2。) 

(5)“ 数 组 是 常 指针 ”。 ( 错 ， 参 见 问 题 6.9。) 

参见 问题 6.8。 


6.11 


H: 我 看 到 一 些 “ 搞 笑 ” 的 代码 ， 包 含 5["abcdef"] 这 样 的 “表达 式 ”。 这 
为 什么 是 合法 的 0 语言 表达 式 呢 ? 

答 : 不 管 你 信 不 信 ， 数 组 和 下 标 在 C 语 言 中 可 以 互 换 。 这 个 奇怪 的 事实 来 自 
数组 下 标的 指针 定义 ， 即 对 于 任何 两 个 表达 式 a 和 e， 只 要 其 中 一 个 是 指针 表达 式 
而 另 一 个 为 整数 ， 则 a[e] 和 

*((a)+(e)) 完 全 一 样 [3]。 

可 以 这 样 来 “证 明 ”: 

ale] 

*((a)+(e)) 《根据 定义 ) 

*((e)+(a)) 《加 法 交换 律 ) 

ela] (根据 定义 ) 

这 种 互 换 性 在 许多 C 语 言 的 书 中 被 看 作 值得 骄傲 的 东西 ， 但 是 它 除 了 在 国际 C 
语言 混乱 代码 竞赛 〈 参 见 问题 20.42) 有 用 之 外 ， 其 实 鲜 有 用 武之 地 。 

因为 C 语 言 中 的 字符 串 就 是 char 型 数组 ， 所 以 表达 式 "abcdef"[5] 是 完全 合法 
的 ， 其 值 就 是 字符 f。 你 可 以 把 它 看 作 以 下 代码 的 缩写 : 

char *tmpptr="abcdef"; 


...tmpptr [5]... 
问题 20.11 有 个 实际 的 例子 。 
参考 资料 : [14, Sec. 3. 3. 2.1] 
[11, Sec. 5. 4. 1 p. 124, Sec. 7. 4. 1 pp. 186-187] 


数组 的 指针 


因为 数组 通 会 常 退化 为 指针 ， 所 以 在 处 理 整个 数组 的 指针 《而 不 是 数组 第 一 
个 元 素 的 指针 ) 的 时 候 特 别 容 易 令 人 困惑 。 


6.12 


P: 既然 数组 引用 会 退化 为 指针 ， 如 果 array 是 数组 ， 那 么 array 和 区 array 
又 有 什么 区 别 呢 ? 答 : 区 别 在 于 类 型 。 

在 标准 C 中 ，&arrary 生 成 一 个 “IT 型 数组 ”的 指针 ， 指 同 整个 数组 。《〈 在 ANSI 
之 前 的 C 中 ，&arrary 中 的 改 通 常会 引起 一 个 警告 ， 而 它 通 常会 被 忽略 。) 在 所 有 
的 C 编 译 器 中 ， 对 数组 的 简单 引用 不 包括 && 操 作 符 〉 生 成 一 个 T 型 的 指针 ， 指 问 
数组 的 第 一 个 元 素 。 

对 于 简单 数组 ， 如 

int al10]; 
Walt s| AMS eine SREP, Ti ace “10 int ARSE. HF 
维 数组 ， 如 
int array [NROWS] [NCOLUMNS] ; 
对 array 的 引用 的 类 型 是 <NCOLUMNS 个 int 的 数组 的 指针 ”， 而 尺 array 的 类 型 
是 “NROWS 个 NCOLUMNS 个 int 的 数组 的 数组 的 指针 ”。 
参见 问题 6.3、6.13 和 6.18。 
参考 资料 : [35, Sec. 3.2.2.1, Sec. 3. 3. 3. 2] 
[8, Sec. 6.2.2.1, Sec. 6. 3. 3. 2] 
[14, Sec. 3. 3. 3. 2] 
[11, Sec. 7.5.6 p. 198] 


6.13 


Pl: 如 何 声明 一 个 数组 的 指针 ? 

答 : 通常 你 不 需要 。 当 人 们 随便 提 到 数组 的 指针 的 时 候 ， 他 们 通常 想 的 是 指 
向 它 的 第 一 个 元 素 的 指针 。 

考虑 使 用 指 同 数组 某 个 元 素 的 指针 ， 而 不 是 数组 的 指针 。 类 型 T 的 数组 退化 
成 类 型 T 的 指针 参见 问题 6.3) ， 这 很 方便 。 在 由 此 产生 的 指针 上 使 用 下 标 或 增 
量 就 可 以 访问 数组 中 单独 的 成 员 。 而 真正 的 数组 指针 ， 在 使 用 下 标 或 增 量 操 作 符 
的 时 候 ， 会 跳 过 整个 数组 ， 通 常 只 在 操作 数组 的 数组 [4] 时 有 用 一 一 如 果 还 有 一 点 
用 的 话 。 参 见 问题 6.18。 

如 果 你 真 的 需要 声明 指向 整个 数组 的 指针 ， 使 用 类 似 “int(*ap)[N];” 这 样 的 声 
明 。 其 中 N 是 数组 的 大 小 (参见 问题 1.21) 。 如 果 数 组 的 大 小 未 知 ， 原 则 上 可 以 
省 略 N， 但 是 这 样 生 成 的 类 型 , “指向 大 小 未 知 的 数组 的 指针 ”， 坚 无 用 处 。 

下 边 这 个 例子 表明 了 简单 指针 和 数组 指针 的 区 别 。 在 这 样 的 声明 下 ， 

int a1[3]={0, 1, 2}; 

int a2[2] [3]={{3, 4,5}, {6, 7, 8}}; 

int *ip; /* pointer to int */ 

int (*ap) [3]; /* pointer to array[3] of int */ 

可 以 使 用 int 型 的 简单 指针 ip 访 问 一 维 数组 al: 

ip=a1; 

printf ("%d", *ip) ; 

ipt+; 

printf ("%d\n", *ip) ; 

这 段 代 码 输出 

0 1 

在 数组 al 上 尝试 使 用 数组 指针 ap: 

ap=&al; 

printf ("%d\n", **ap) ; 

ap++; /* WRONG */ 

printf ("%d\n", **ap) ; /* undefined */ 

会 在 第 一 行 打印 出 0， 而 在 第 二 行 打印 出 未 定义 的 东西 〈 或 者 直接 导致 系统 
Bain) 。 数 组 的 指针 只 有 在 访问 数组 的 数组 〈 如 a2) 时 才 有 用 : 


ap=a2; 
printf ("%d %d\n", (ap) [0], (Kap) [1] ) ; 


apt+; /* steps over entire (sub) array */ 
printf ("%d %d\n", (*ap) [0], (Kap) [1]) ; 

这 段 代 码 会 打印 出 

3 4 

6 7 


参见 问题 6.12。 
参考 资料 : [35, Sec. 3.2.2.1] 
[8, Sec. 6.2.2.1] 


动态 数组 分 配 


数组 和 指针 的 紧密 联系 使 得 用 指向 动态 分 配 的 内 存 的 指针 来 模拟 运行 时 才能 
确定 大 小 的 数组 十 分 容易 。 


6.14 


问 : 如 何在 运行 时 设 定数 组 的 大 小 ?怎样 才能 避免 固定 大 小 的 数组 ? 

答 : 由 于 数组 和 指针 的 等 价 性 《参见 问题 63) ， 可 以 用 指向 malloc 分 配 的 内 
存 的 指针 来 高 效 地 模拟 数组 。 执 行 

#include=stdlib.h> 

int *dynarray=(int *)malloc(10 * sizeof (int)) ; 

以 后 (如 果 malloc 调 用 成 功 ) ， 你 可 以 像 传 统 的 静态 分 配 的 数组 那样 引用 
dynarry[i] (i 从 0 到 9〉。 唯 一 的 区 别 是 sizeof 不 能 给 出 “数组 ”的 大 小 。 参 见 问题 
1.33、6.16、7.32 和 7.33。 
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问 : 我 如 何 声 明 大 小 和 传 入 的 数组 一 样 的 局 部 数组 ? 

答 : 直到 最 近 才 可 以 。C 语 言 的 数组 维度 一 直 都 是 编译 时 和 常数。 但是，C99 引 
入 的 变 长 数组 (VLA) 解决 了 这 个 问题 。 局 部 数组 的 大 小 可 以 用 变量 或 其 他 表达 
式 设置 ， 可 能 也 包括 函数 参数 。〈gcc 提 供 参数 化 数组 作为 扩展 已 经 有 些 时 候 
了 。) 如 果 你 不 能 使 用 C99 或 gcc， 你 必须 使 用 malloc()， 并 在 函数 返回 之 前 调用 
free()。 参 见 问题 6.14、6.16、6.19、7.26 和 7.36。 

参考 资料 : [8, Sec. 6. 4, Sec. 6. 5. 4. 2] 

[9, Sec. 6. 5. 5. 2] 


(ep) 
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问 : 如 何 动态 分 配 多 维 数组 ? 

答 : 传统 的 解决 方案 是 分 配 一 个 指针 数组 ， 然 后 把 每 个 指针 初始 化 为 动态 分 
配 的 “ 行 ”。 以 下 为 一 个 二 维 的 例子 ， 

#include<stdl ib. h> 

int **array1=malloc(nrows * sizeof (int *)); 


for (i=0; i<nrows; i++) 


array1Lil=malloc(ncolumns * sizeof (int)) ; 
当然 ， 在 真实 代码 中 ， 所 有 的 malloc 返回 值 都 必须 检查 。 也 可 以 使 用 
sizeof(*array1)#llsizeof(**array1){t # sizeof(int*) #lsizeof(int). 
你 可 以 让 数组 的 内 容 连 续 ， 但 在 后 来 重新 分 配 行 的 时 候 会 比较 困难 ， 得 使 用 
一 点 指针 算术 : 
int **array2=mal loc (nrows * sizeof (int *)); 
array2[0]=malloc(nrows * ncolumns * sizeof (int)) ; 
for (i=1; i<nrows; i++) 
array2Lil=array2[0]+i * ncolumns; 
在 两 种 情况 下 ， 动 态 数 组 的 元 素 都 可 以 用 正常 的 数组 下 标 arrayx[i][j (0 < i< 
nrows 和 0 <j<ncolumns) 来 访问 。 下 图 显示 了 array1 和 array2 的 内 存 布 局 。 
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ncolumns 

如 果 上 述 方案 的 两 次 间接 的 访问 因为 某 种 原因 不 能 被 接受 ， 你 还 可 以 用 一 个 
动态 分 配 的 一 维 数组 来 模拟 二 维 数组 [5] 

int *array3=malloc(nrows * ncolumns * sizeof (int)) ; 

但 是 ， 你 现在 必须 手工 计算 下 标 ， 用 array3[i * ncolumns+j] 访 问 第 i、j 个 元 
素 。[6] 参 见 问题 6.19。 

另 一 种 选择 是 使 用 数组 指针 : 

int (*array4) [NCOLUMNS]=malloc (nrows * sizeof(karray4) ) ; 

或 者 ， 甚 至 

int (*array5) [NROWS] [NCOLUMNS]=mal loc (sizeof (karray5) ) ; 

但 是 ， 这 个 语法 十 分 可 怕 而 且 运 行 时 最 多 只 能 确定 一 维 。 

当然 ， 使 用 这 些 技 术 ， 你 都 必须 记 住 在 不 用 的 时 候 释放 数组 。 对 于 数组 
arrayl1 和 array2， 可 能 需要 多 个 步骤 。 参 见 问题 7.27)〉。 

for (i=0; i<nrows; i++) 

free((void *)array1Li]); 
free((void *)array1) ; 
free((void *)array2[0]); 


free((void *)array2) ; 


而 且 你 可 能 不 能 混用 动态 分 配 的 数组 和 传统 的 静态 分 配 数组 。 参 见 问题 6.20 


和 6.18。 


三 维 


所 有 这 些 技术 都 可 以 扩展 到 三 维 或 更 多 维 数组 。 这 是 一 个 使 用 第 一 种 技术 的 
数组 版 本 : 
int ***a3d=(int ***)malloc (xdim * sizeof (int **)) ; 
for (i=0; i<xdim; i++) { 

a3d[i]=(int **)malloc(ydim * sizeof (int *)); 

for (j=0; j<ydim; j++) 

a3d[i] [j]=(int *)malloc(zdim * sizeof (int)); 

} 
最 后 ， 在 C99 中 你 可 以 使 用 变 长 数组 。 
参见 问题 20.2。 
参考 资料 : 9, Sec. 6. 5. 5. 2] 


6.17 
问 : 有 个 很 好 的 窍门 ， 如 果 我 这 样 写 : 
int realarray[10] ; 
int *array=&realarray[-1]; 
我 就 可 以 把 “array” 当 作 下 标 从 1 开始 的 数组 。 
答 : 尽管 这 种 技术 颇 有 吸引 力 〈 而 且 在 Numerical Recipes in C 一 书 的 旧版 中 


使 用 过 ) ， 但 它 不 完全 符合 C 标 准 。 只 有 当 指 针 指 向 同一 个 已 分 配 内 存 块 或 者 指 
回 虚构 的 “终结 ”元 素 后 的 一 个 时 ， 指 针 算术 才 有 定义 ; 否则， 即使 指针 并 未 解 引 


用 ， 其 行为 仍然 是 未 定义 的 。 问 题 中 的 代码 计算 realarray 开 始 之 前 的 内 存 的 指 


针 ， 


如 果 在 用 仍 移 量 作 下 标 运 算 的 时 候 生 成 了 非法 地 址 “可 能 因为 地 址 在 经 过 某 


个 内 存 段 之 后 “ 回 绕 *”) ， 则 这 段 代 码 会 失败 。 


206] 


参考 资料 : [19, Sec.5.3 p.100,Sec.5.4 pp. 102-103, Sec. A7.7 pp. 205- 


[8, Sec. 6. 3. 6] 
[14, Sec. 3. 2. 2. 3] 


函数 和 多 维 数组 


问 函数 传递 多 维 数组 一 般 比 较 困 难 。 将 数组 参数 重 写 成 指针 《〈 如 问题 6.4 所 讨 
论 的 ) 意味 着 接受 简单 数组 的 函数 好 像 接受 了 任意 长 度 的 数组 ， 这 很 方便 。 然 
而 ， 参 数 重 写 只 对 “最 外 层 ” 数 组 有 效 ， 因 此 多 维 数 组 的 更 高 的 维度 和 “宽度 ”不 能 
同时 变化 。 这 个 问题 的 部 分 原因 是 ， 在 标准 C 语 言 中 ， 数 组 的 维度 总 是 在 编译 时 
确定 的 常量 ， 不 能 通过 函数 的 其 他 参数 来 确定 。 


6.18 


问 : 当 我 向 一 个 接受 指针 的 指针 的 函数 传 入 二 维 数组 的 时 候 ， 编 译 器 报错 
ts 

答 : 数组 退化 为 指针 的 规则 (参见 问题 6.3) 不 能 递归 应 用 。 数 组 的 数组 ( 即 
C 语 言 中 的 二 维 数组 〉 退 化 为 数组 的 指针 ， 而 不 是 指针 的 指针 。 数 组 指针 常常 令 
人 困惑 ， 需 要 小 心 对 待 ， 参 见 问题 6.13。 (有 些 错 误 的 编译 器 让 这 个 问题 更 加 令 
人 困惑 。 有 些 旧 版 的 pcc 和 源 自 pcc 的 lint 错 误 地 在 多 级 指针 的 函数 参数 中 接受 多 维 
数组 。 

如 果 你 向 函数 传递 二 维 数 组 : 

int array [NROWS] [NCOLUMNS] ; 

f (array) ; 

那么 函数 的 声明 必须 匹配 ; 

void f (int a[] [NCOLUMNS]) 

Paul 

或 者 

void f (int (*ap) [NCOLUMNS] ) /*ap is a pointer to an array */ 

{ ...} 

在 第 一 个 声明 中 ， 编 译 器 进行 了 通常 的 从 “数组 的 数组 到 “数组 的 指针 ?的 隐 
式 转换 《参见 问题 63 和 6.4) ; 第 二 种 形式 中 的 指针 定义 显而易见 。 因 为 被 调用 


的 函数 并 不 为 数组 分 配 地 址 ， 所 以 它 并 不 需要 知道 总 的 大 小 ， 所 以 行 数 NROWS 
可 以 省 略 。 但 数组 的 宽度 依然 重要 ， 所 以 列 维度 NCOLUMNS (对 于 三 维 或 更 多 
维 数 组 来 说 ， 指 相关 的 维度 ) 必须 保留 。 
如 果 一 个 函数 已 经 声明 为 接受 指针 的 指针 ， 那 么 直接 向 它 传 入 二 维 数组 可 能 
训 无 意义 。 可 以 使 用 一 个 中 间 指 针 来 进行 调用 : 
extern g(int **ipp) ; 
int *ip=&arrayL0] [0]; 
g(&ip); /* PROBABLY WRONG */ 
但 是 ， 这 种 用 法 带 有 误导 性 ， 而 且 几 乎 一 定 错误 ， 因 为 数组 被 < 扁平 化 "了 
CERATION) » 
参见 问题 6.12 和 6.15。 
参考 资料 : [18, Sec. 5. 10 p. 110] 
[19, Sec. 5.9 p. 113] 
[11, Sec. 5.4.3 p. 126] 


6.19 


问 : 我 怎样 编写 接受 编译 时 宽度 未 知 的 二 维 数组 的 函数 ? 

答 : 这 并 非 易 事 。 一 种 办 法 是 传 入 指向 [0][0] 成 员 的 的 指针 和 两 个 维度 ， 然 
后 “手工 ?模拟 数组 下 标 。 

void f2(int *aryp, int nrows, int ncolumns) 

{ ...array[i] [被 作为 aryp[i * ncolumns+jj] 访 问 ...] 

这 个 函数 可 以 用 问题 6.18 的 数组 如 下 调用 : 

f2(&array [0] [0], NROWS, NCOLUMNS) ; 

但 是 ， 必 须 说 明 的 一 点 是 ， 用 这 种 方法 通过 “手工 ”方式 模拟 下 标的 程序 未 能 
严格 遵循 ANSI C 标 准 。 根 据 官 方 的 解释 ， 当 x 二 =NCOLUMNS 时 ， 访 问 &array[0] 
[0][x] 的 结果 未 定义 。 

C99 人 允许 变 长 数组 ， 一 旦 接受 C99 扩 展 的 编译 器 广泛 流传 以 后 ，VLA 可 能 是 首 
选 的 解决 方案 。gcc 文 持 可 变数 组 已 经 有 些 时 日 了 。 

当 你 需要 使 用 各 种 大 小 的 多 维 数组 的 函数 时 ， 一 种 解决 方案 是 像 问题 6.16 那 
样 动 态 模拟 所 有 的 数组 。 


参见 问题 6.18、6.20、6.15。 
参考 资料 : [8,Sec.6.3.6] 
[9,Sec.6.5.5.2] 


6.20 


问 : 我 怎样 在 函数 参数 传递 时 混用 静态 和 动态 多 维 数组 ? 
B: 没有 完美 的 方法 。 假 设 有 如 下 声明 : 
int array[NROWS] [NCOLUMNS] ; 


int **array1; /* ragged */ 
int **array2; /* contiguous */ 
int *array3; /* "flattened" */ 


int (*array4) [NCOLUMNS] ; 

int (*array5) [NROWS] [NCOLUMNS] ; 

指针 的 初始 化 如 问题 6.16 的 程序 片段 ， 函 数 声 明 如 下 : 

void fia(int a[] [NCOLUMNS], int nrows, int ncolumns) ; 
void fib(int (ka) [NCOLUMNS], int nrows, int ncolumns) ; 
void f2(int *aryp, int nrows, int ncolumns) ; 


void f3(int **pp, int nrows, int ncolumns) ; 


其 中 f1a(O) 和 f1b() 接 受 传统 的 二 维 数 组 ，f20 接 受 “ 局 平 的 ”二 维 数组 ，f3() 接 受 


指针 的 指针 模拟 的 数组 (参见 问题 6.18 和 6.19) ， 下 面 的 调用 应 该 可 以 如 愿 运 


ÍT: 


fla (array, NROWS, NCOLUMNS) ; 

f1b (array, NROWS, NCOLUMNS) ; 
f1a(array4, nrows, NCOLUMNS) ; 

f1b (array4, nrows, NCOLUMNS) ; 

f1 (*array5, NROWS, NCOLUMNS) ; 

£2 (&array [0] [0], NROWS, NCOLUMNS) ; 
f2 (*ar ray, NROWS, NCOLUMNS) ; 

f2 (*array2, nrows, ncolumns) ; 


f2 (array3, nrows, ncolumns) ; 


f2 (*array4, nrows, NCOLUMNS) ; 

f2 (**ar ray5, NROWS, NCOLUMNS) ; 

f3 (array1, nrows, ncolumns) ; 

f3 (array2, nrows, ncolumns) ; 

下 面 的 调用 在 大 多 数 系统 上 可 能 可 行 ， 但 是 有 一 些 可 疑 的 类 型 转换 ， 而 且 只 
有 动态 ncolumns 和 静态 NCOLUMNS 匹 配 才 行 : 

fia((int (*) [NCOLUMNS]) (*array2) , nrows, ncolumns) ; 

fla((int (*) [NCOLUMNS]) (*array2) , nrows, ncolumns) ; 

fib((int (*) [NCOLUMNS]) array3, nrows, ncolumns) ; 

fib((int (*) [NCOLUMNS]) array3, nrows, ncolumns) ; 

同时 必须 注意 ， 向 人 0 传递 &array[0][0] 〈 或 者 等 价 的 *array) 并 不 完全 符合 标 
准 。 参 见 问题 6.19。 

如 果 你 能 理解 为 何 上 述 调用 可 行 且 必须 这 样 书写 ， 而 未 列 出 的 组 合 不 行 ， 那 
么 你 对 C 语 言 中 的 数组 和 指针 就 有 了 很 好 的 理解 了 。 

为 了 避免 受 这 些 东西 的 困惑 ， 一 种 使 用 各 种 大 小 的 多 维 数组 的 办 法 是 令 它 
们 “全 部 ?动态 分 配 ， 如 问题 6.16 所 述 。 如 果 没 有 静态 多 维 数组 一 如 果 所 有 的 数组 
都 按 问 题 6.16 的 array1 和 array2 分 配 一 -那么 所 有 的 函数 都 可 以 写成 f3(0) 的 形式 。 


数组 的 大 小 


sizeof 操 作 符 如 果 能 够 判断 出 数组 的 大 小 ， 它 束 会 返回 数组 的 大 小 。 如 果 数 组 
的 大 小 未 知 或 者 数组 已 经 退化 为 指针 ， 则 它 不 能 提供 数组 的 大 小 。 


6.21 


H: 当 数 组 是 函数 的 参数 时 ， 为 什么 sizeof 不 能 正确 报告 数组 的 大 小 ? 这 个 
测试 函数 打印 出 4 而 不 是 10: 
f(char a[10]) 
int i=sizeof (a) ; 
printf ("%d\n", i); 
} 
答 : 编译 器 把 数组 参数 当 作 指针 对 待 〈 在 本 例 中 当成 char *a， 人 参见 问题 
6.4) ， 因 而 sizeof 报 告 的 是 指针 的 大 小 。 参 见 问题 1.24 和 7.32。 
参考 资料 : [11, Sec. 7. 5.2 p. 195] 
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问 : 如 何在 一 个 文件 中 判断 声明 为 extern 的 数组 的 大 小 〈 例 如 ， 数 组 定义 和 
大 小 在 另 一 个 文件 中 ) ? sizeof 操 作 符 似乎 不 行 。 
答 : 参见 问题 1.24。 


© 
N 
Qo 


问 : sizeof 返 回 的 大 小 是 以 字 节 计算 的 ， 怎 样 才 能 判断 数组 中 有 多 少 个 元 素 
呢 ? 


答 : 只 需要 用 一 个 元 素 的 大 小 去 除 整 个 数组 的 大 小 即 可 : 
int array[]={1, 2,3}; 
int narray=sizeof(array)/ sizeof (array[0]) ; 
参考 资料 : [35, Sec. 3. 3. 3. 4] 
[8, Sec. 6. 3. 3. 4] 


[对 “任何 位 置 ? 和 “哪里 也 不 ”的 理解 不 能 太 教 条 。 一 个 指针 必须 指向 正确 分 配 的 
内 存 才 有 效 ( 参 见 问题 7.1、7.2 和 7.3) ; 要 哪里 也 不 指 ， 指 针 必 须 是 空 指针 CS 
见 问题 5.1) 。 

[21. 左 值 (value) 原来 的 定义 的 确 跟 赋 值 表达 式 的 左 侧 有 关 。 


显然 ， 一 般 来 说 ，a[ 让 [jj 和 a[j] 中 是 不 同 


[4. 这 个 讨论 也 适用 于 三 维 或 更 多 维 数组 。 
[51. 但 请 注意 ， 两 次 间接 的 访问 并 不 一 定 比 乘法 的 索引 访问 低 效 。 
[6]. 使 用 #deinfe Arrayaccess(a,i,j)((a)[(i)* ncolumns+(j)]) 这 样 的 宏 可 以 隐藏 显 式 的 计 


算 。 但 是 调用 它 的 时 候 要 使 用 括号 和 逗号 ， 这 看 起 来 不 太 像 多 维 数组 语法 ， 而 且 
宏 也 需要 至 少 访问 数组 的 一 维 。 


第 7 章 内 存 分 配 


很 多 人 都 认为 指针 是 C 语 言 中 最 难 学 习 的 部 分 。 然 而 ， 很 多 时 候 问 题 并 不 在 
于 管理 指针 而 在 于 管理 它们 指向 的 内 存 。 因 为 C 语 言 的 底层 特征 ， 通 常 都 需要 程 
学 员 负 责 显 式 分 配 内 存 ， 但 是 往往 很 容易 忽视 指针 指向 的 对 象 的 分 配 。 使 用 指向 
没有 正确 分 配 的 内 存 的 指针 是 永 无 休止 的 严重 pug 来 源 。 


基本 的 内 存 分 配 问题 


就 算 没有 调用 malloc， 也 必须 确保 要 使 用 的 内 存 〈 尤 其 是 指针 指 同 的 内 存 ) 
正确 分 配 。 


H: 为 什么 这 段 代 码 不 行 ? 

char *answer ; 

printf ("Type something: \n") ; 

gets (answer) ; 

printf ("You typed \"%s\"\n", answer) ; 

答 : 传 入 gets0 的 指针 变量 answer， 意 在 指向 保存 得 到 的 应 答 的 位 置 ， 但 它 却 
没有 指向 任何 合法 的 位 置 。 它 是 个 未 初始 化 的 变量 ， 正 如 

int 1; 

printf ("i=%d\n", i); 

中 的 i 一样 。 

换言之 ， 我 们 不 知道 指针 answer 指 同 何 处 。 因 为 局 部 变量 没有 初始 化 ， 通 向 
包含 垃圾 信息 ， 所 以 甚至 都 不 能 保证 answer 是 一 个 空 指针 。 参 见 问题 1.31 和 5.1。 

改正 提问 程序 的 最 简单 方案 是 使 用 局 部 数组 而 不 是 指针 ， 让 编译 器 去 操心 内 
存 分 配 的 问题 : 

#include<stdio. h> 

#include<string. h> 


char answer [100], *p; 

printf ("Type something: \n") ; 

fgets (answer, sizeof answer, stdin) ; 

if ((p=strchr (answer, '\n')) !=NULL) 
*p=' \0'; 


printf ("You typed \"%s\"\n", answer) ; 

本 例 中 同时 用 fgets0 代 蔡 gets0， 以 确保 array 的 结束 符 不 被 改写 。“〈 人 参见 问题 
12.25。 但 是 ， 本 例 中 的 fgets0 不 会 像 gets0 那 样 自 动 地 去 掉 结 尾 的 nm。) 也 可 以 用 
malloc0O 分 配 answer 绥 冲 区 ， 并 对 缓冲 区 的 大 小 进行 参数 化 。 例 如 : 

#def ine ANSWERSIZE 100 


La 


问 : 我 的 strcat 0 Hit. RIAT Fars: 

char *s1="Hel lo, "; 

char *s2="world!"; 

char *s3=strcat (s1, s2); 

但 是 我 得 到 了 奇怪 的 结 

答 : 跟前 面 的 问题 7.1 一样 ， 这 里 主要 的 问题 是 没有 正确 地 为 拼接 的 结果 分 
配 空间 。C 语 言 没 有 提供 自动 管理 的 字符 串 类 型 。C 编 译 器 只 为 源码 中 显 式 提 到 的 
对 象 分 配 空 间 ( 对 于 字符 串 ， 这 包括 字符 数组 和 字符 串 字 面 量 ) 。 程 序 员 必须 为 
像 字符 串 拼 接 这 样 运行 时 操作 的 结果 分 配 足 够 的 空间 ， 通 常 可 以 通过 声明 数组 或 
调用 malloc0 完 成 。 

strcat() 不 进行 任何 内 存 分 配 。 第 二 个 省 会 原样 不 动 地 附加 在 第 一 个 之 后 。 
此 ， 一 种 解决 办 法 是 把 第 一 个 串 声明 为 数组 : 

char s1[20]="Hel lo, "; 

当然 ， 在 成 品 代码 中 ， 我 们 不 会 使 用 像 “20” 这 样 的 幻 数 。 我 们 会 使 用 更 健壮 
的 机 制 来 保证 足够 的 空间 。 

由 于 strcat() 返 回 第 一 个 参数 的 值 ( 本 例 中 为 s1，，s3 实 际 上 是 多 余 的 。 在 
strcat() 调 用 之 后 ，s1 包 含 结果 。 

提问 中 的 strcat0 调 用 实际 上 有 两 个 问题 ，s1 指 向 的 字符 串 字面 量 ， 除 了 空间 
不 足以 放 入 拼接 的 字符 串 之 外 ， 甚 至 都 不 一 定 可 写 。 参 见 问题 1.34。 

参考 资料 : [22, Sec. 3. 2 p. 32] 


问 : 但 是 strcat 的 文档 说 它 接受 两 个 char +* 型 参数 。 我 怎么 知道 (空间 ) 分 
配 的 事情 呢 ? 

答 : 一 般 来 说 ， 使 用 指针 的 时 候 ， 必 须 总 是 考虑 内 存 分 配 ， 除 非 明 确 知道 编 
译 器 蔡 你 做 了 此 事 。 如 果 一 个 库 函 数 的 文档 没有 明确 提 到 内 存 分 配 ， 那 么 通常 需 
要 调用 者 来 考虑 。 

UNIX 型 的 手册 页 顶部 的 大 纲 段 落 或 ANSI C 标 准 有 些 误导 作用 。 那 里 展示 的 
程序 片段 更 像 是 实现 者 使 用 的 函数 定义 而 不 是 调用 者 使 用 的 调用 。 特 别 地 ， 很 多 
接受 指针 《如 结构 指针 或 字符 串 指针 ) 的 函数 通常 在 调用 时 都 用 到 某 个 由 调用 者 
分 配 的 对 象 〈 结 构 或 数组 一 一 参见 问题 63 和 6.4) 的 指针 。 其 他 的 常见 例子 还 有 
time) 〈 参 见 问题 13.12) 和 stat()。 


间 : 我 刚才 试 了 这 样 的 代码 : 

char *p; 

strcpy (p, "abc") ; 

它 运行 正常 。 怎 么 回 事 ? 为 什么 它 没有 出 错 ? 

答 : 我 猜 你 的 运气 来 了 。 未 初始 化 的 指针 p 所 指向 的 随机 地 址 对 你 来 说 恰好 
是 可 写 的 ， 而 且 很 显然 也 没有 什么 关键 的 数据 。 参 见 问题 11.38。 


La 


Pl: 一 个 指针 变量 分 配 多 少 内 存 ? 

答 : 这 是 个 挺 有 误导 性 的 问题 。 当 你 像 这 样 声 明 一 个 指针 变量 的 时 候 : 

char *p; 

你 《或 者 ， 更 准确 地 讲 ， 编 译 器 ) 只 分 配 了 足够 容纳 指针 本 身 的 内 存 。 也 就 
是 说 ， 这 种 情况 下 ， 你 分 配 了 sizeof(char *) 个 字 节 的 内 存 。 但 你 还 没有 分 配 任 何 
让 指针 指向 的 内 存 。 参 见 问题 7.1 和 7.2。 


7.6 


问 : 我 用 这 样 的 代码 将 文件 的 所 有 行 读 入 一 个 数组 : 
char | inebuf [80]; 
char *lines[100]; 
int 1; 
for (i=0; i<100; i++) { 
char *p=fgets (| inebuf, 80, fp) ; 
i f (p==NULL) break; 
linesLi]=p; 


为 什么 读 入 的 每 一 行 都 是 最 后 一 行 的 内 容 呢 ? 

答 : 你 只 分 配 了 一 行 的 内 存 : linebuf。 每 次 调用 fgets 的 时 候 ， 前 一 行 的 内 容 
aI 了 了。 除非 fgets 遇 到 了 EOF 或 出 现 了 错误 ， 否 则 它 是 不 会 分 配 内 存 的 ， 它 
返回 的 指针 就 是 你 传 入 的 第 一 个 参数 〈 本 例 中 ， 就 是 指向 linebuf 数 组 的 指针 ) 。 
要 让 这 样 的 代码 工作 ， 需 要 为 每 一 行 都 分 配 内 存 。 问 题 20.2 中 有 个 例子 。 

参考 资料 : [18, Sec. 7.8 p. 155] 
[19, Sec. 7.7 pp. 164-165] 
[35, Sec. 4.9. 7. 2] 
[8, Sec. 7.9. 7. 2] 
[11, Sec. 15.7 p. 356] 


ed 


问 : 我 有 个 函数 ， a 但 当 它 返回 调用 者 的 时 候 ， 返 回 的 
字符 串 却 是 垃圾 信息 。 为 什么 

答 : 任何 时 候 ， 如 果 函 数 返 回 指针 ， 必 须 确保 它 指向 的 内 存 已 经 正确 分 配 
了 。 返 回 的 指针 可 以 指 同 静态 分 配 的 、 调 用 者 传 入 的 或 通过 malloc 调 用 获得 的 组 
冲 区 ， 但 不 能 是 局 部 的 (自动 ) 数组。 换言之 ， 绝 不 能 这 样 做 : 

#include<stdio. h> 

char *itoa(int n) 

{ 

char retbuf [20] ; /* WRONG */ 


sprintf (retbuf, "%d", n) ; 
return retbuf; /* WRONG */ 

} 

函数 返回 的 时 候 ， 它 的 自动 局 部 变量 都 会 被 抛弃 。 因 此 这 里 返回 的 指针 是 无 
效 的 〈 它 指向 一 个 已 经 不 存在 的 数组 ) 。 一 种 解决 方案 是 把 返回 缓冲 区 声明 为 

static char retbuf [20] ; 

本 方案 并 不 完美 ， 因 为 使 用 静态 数据 的 函数 不 可 再 入 。 而 且 连 续 地 调用 这 个 
函数 会 导致 同一 个 返回 缓冲 区 被 履 盖 : 调用 者 不 能 多 次 调用 这 个 函数 并 同时 保存 
所 有 的 返回 值 。 

男 一 种 解决 方案 是 让 调用 者 传 入 保存 结果 的 空间 : 

char *itoa(int n,char *retbuf) 


{ 


sprintf (retbuf, "%d", n); 
return retbuf; 


} 


char str[20]; 

itoa (123, str) ; 

还 有 一 种 方法 是 使 用 malloc: 
#include<stdl ib. h> 
char *itoa(int n) 


{ 


char *retbuf=mal loc (20) ; 
if (retbuf !=NULL) 

sprintf (retbuf, "%d", n); 
return retbuf; 


} 


char *str=itoa (123) ; 
这 种 情况 下 ， 调 用 者 必须 记 住 在 不 使 用 的 时 候 释放 返回 的 指针 。 参 见 问 题 


7.8. 12.23#120.1. 
参考 资料 : [35, Sec. 3.1.2.4] 
[8, Sec. 6.1.2.4] 


7.8 


问 : 那么 返回 字符 串 或 其 他 聚集 的 正确 方法 是 什么 呢 ? 

答 : 返回 指针 必须 是 静态 分 配 的 缓冲 区 《〈 如 问题 7.7 的 答案 所 述 ) ， 或 者 调用 
者 传 入 的 绥 冲 区 ， 或 者 用 malloc() 获 得 的 内 存 ， 但 不 能 是 局 部 自动) 数组。 

参见 问题 20.1。 


Vil H malloc 


如 果 需 要 比 静 态 分 配 更 加 灵活 的 数据 ， 就 要 使 用 动态 内 存 分 配 。 通 常 使 用 
malloc。 本 节 的 问题 包含 了 malloc 调 用 的 基本 情况 ， 下 一 节 会 涉及 malloc 调 用 失败 
的 情况 。 


L9 


H: 为 什么 在 调用 malloc () 时 报 出 了 “waring: assignment of pointer 
from integer lacks a cast” ? 

答 : 你 包含 了 <stdlib.h> 或 者 正确 声明 了 mallocO 吗 ?如 果 没 有 ， 编 译 器 会 认 
为 它 返回 int 《参见 问题 1.25) ， 而 这 是 错误 的 。 (对 于 calloc 和 realloc 也 有 同样 的 
问题 。) 参见 问题 7.19。 

参考 资料 : [11, Sec. 4.7 p. 101] 


7.10 


H: AZ ARABS BS jemal locit E WA KR A BL 48 A KA? 

答 : 在 ANSIISO 标 准 C 引 入 void * 通 用 指针 类 型 之 前 ， 这 种 类 型 转换 通常 用 于 
在 不 兼容 的 指针 类 型 间 赋 值 时 消除 警告 〈 或 许 也 可 能 导致 转换 ) 。 

在 ANSIISO 标 准 C 下 ， 这 些 转换 不 再 需要 ， 而 且 事实 上 现在 的 实践 也 不 鼓励 
这 样 做 ， 因 为 它们 可 能 掩盖 mallocO0 声 明 错 误 时 产生 的 重要 警告 。 参 见 上 面 的 问题 
7.9。 况 且 ， 定 义 明确 的 、 低 风险 的 隐 式 类 型 转换 《例如 C 语 言 中 一 直 进 行 的 整数 
和 浮 点 数 之 间 的 那 种 转换 ) 也 常常 被 看 做 是 一 种 功能 。 

另 一 方面 ， 有 些 程序 员 更 希望 显 式 表达 每 一 次 类 型 转换 ， 以 示 他 们 对 每 种 情 
况 都 考虑 周到 且 明 确 决定 应 该 发 生 什 么 〈 参 见 问题 17.5) 。 本 书 中 使 用 显 式 的 类 
型 转换 主要 是 为 了 让 书 中 的 代码 对 使 用 ANSI 前 编译 器 的 读者 更 加 容易 理解 。 

(顺便 提 及 ，K&R2 的 6.5 和 7.8.5 节 建议 必须 进行 这 种 转换 其 实 有 点 “过 于 热 
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的 转换 。 在 C++ 中 从 void * 的 显 式 转换 是 必需 的 。) 


是 否 进 行 这 样 的 类 型 转换 是 个 风格 问题 。 参 见 第 17 章 。 
参考 资料 : [11, Sec. 16.1 pp. 386-387] 
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问 : 在 调用 malloc() 的 时 候 ， 错 误 “ 不 能 把 void * 转 换 为 iInt *” ZHAB 


B: 说 明 你 用 的 是 C++ 编译 器 而 不 是 C 编 译 器 。 参 见 问题 7.10。 


Er。 
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H: 我 看 到 下 面 这 样 的 代码 : 

char *p=malloc (strlen(s)+1); 

strcpy (p, s) ; 

难道 不 应 该 是 malloc((strlen(s)+1)# sizeof (char) ) 4? 


答 : 永远 也 不 必 乘 上 sizeof(chan， 因 为 根据 定义 ，sizeof(cham 严 格 为 1。 另 一 


te 


方面 ， 乘 上 sizeof(char) 也 没有 害处 ， 有 时 候 还 可 以 帮忙 为 表达 式 引 入 size_t 类 型 。 
参见 问题 8.9 和 8.10。 


参考 资料 : [8, Sec. 6. 3. 3. 4] 
[11, Sec. 7. 5. 2 p. 195] 


7.1 


问 : 我 为 malloc 写 了 一 个 小 小 的 封装 函数 。 它 为 什么 不 行 ? 
#include<stdio. h> 

#include<stdl ib. h> 

mymalloc(void *retp, size_t size) 


{ 


retp=mal loc (size); 

if (retp==NULL) { 
fprintf(stderr, “out of memory\n") ; 
exit (EXIT_FAILURE) ; 


— 


} 
Z: 参见 问题 48。《 在 这 里 ， 你 需要 让 myalloc 返 回 分 配 的 指针 。 


N 
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问 : 我 想 声明 一 个 指针 并 向 它 分 配 一 些 内 存 ， 但 是 不 行 。 这 样 的 代码 有 什么 
问题 ? 

char *p; 

*p=mal loc (10) ; 

答 : 参见 问题 4.2。 


7.15 
问 : 我 如 何 动态 分 配 数组 ? 
答 : 参见 问题 6.14 和 6.16。 

7.16 
H: 怎样 判断 还 有 多 少 内 存 ? 
答 : 参见 问题 19.27。 

7.17 


问 : malloc(0) 是 返回 空 指 针 还 是 指向 0 个 字 节 的 指针 ? 
答 : 参见 问题 11.28。 


7.18 


问 : 我 听 说 有 的 操作 系统 在 程序 使 用 的 时 候 才 真正 分 配 malloc 申 请 的 内 存 。 
这 合法 吗 ? 

答 : 很 难说 。 标 准 没有 说 操作 系统 可 以 这 样 做 ， 但 它 也 没有 明确 说 不 能 。 
《这 样 “ 延 迟 失 败 ” 的 实现 好 像 不 能 满足 标准 的 隐 含 要 求 。) 

很 明显 的 问题 是 ， 当 程序 需要 使 用 那 块 内 存 的 时 候 ， 可 能 已 经 没有 内 存 了 。 
这 种 情况 下 ， 程 序 通常 应 该 被 操作 系统 中 断 ， 因 为 C 语 言 本 身 并 没有 提供 这 样 的 
机 制 。 (显然 ， 如 果 没 有 内 存 ，malloc 应 该 返回 一 个 空 指针 ， 只 要 程序 检查 了 
malloc 的 返回 值 ， 它 就 不 会 试图 使 用 并 不 存在 的 内 存 。) 

这 样 进行 “懒惰 分 配 ” 的 系统 通常 会 提供 额外 的 信号 ， 表 明 内 存 已 经 低 到 危 
险 ， 但 是 可 移植 或 不 健壮 的 程序 可 能 并 不 会 捕捉 到 它们 。 有 些 “ 懒 惰 分 配 ?的 系统 
会 提供 基于 进程 或 用 户 的 关 掉 它 的 方法 〈 恢 复 传 统 的 malloc 语 义 ) ， 但 是 具体 的 
细节 在 每 个 系统 上 都 不 尽 相 同 。 

参考 资料 : [35, Sec. 4. 10. 3] 

[8, Sec. 7. 10. 3] 


有 关 malloc 的 问题 


7.1 


Pl: 为 什么 malloc 返 回 了 离谱 的 指针 值 ? 我 的 确 读 过 问题 7.9， 而 且 也 在 调 
用 之 前 包 念 了 extern void *malloc() ;声明 。 

答 : malloc 的 参数 是 size_t 类 型 的 ， 它 被 定义 成 了 unsigned long。 如 果 你 传 入 
int (或 者 甚至 unsigned int) 类 型 ，malloc 收 到 的 可 能 是 垃圾 (类 似 地 ， 如 果 size_t 
是 int， 而 你 传 入 了 long 型 ， 同 样 会 出 错 ) 。 

一 般 而 言 ， 通 过 包含 正确 的 头 文 件 来 声明 标准 库 函 数 比 自己 直接 键入 extern 
声明 要 安全 得 多 。 人 参见 问题 7.20。 

有 个 相关 的 问题 是 ， 用 printf 的 %d 格 式 打 印 size thE 〈 包 括 sizeof 的 结果 ) 也 
是 不 安全 的 。 可 移植 的 方法 是 使 用 显 式 的 〈unsigned long) 转换 和 %lu 格 式 : 
printf("%lun",(unsignedlong)sizeof(int))。 参 见 问 题 15.3。 

参考 资料 : [35, Sec. 4.1.5, Sec. 4. 1. 6] 

[8, Sec. 7. 1. 6, Sec. 7.1.7] 


7.20 


H: 我 用 一 行 这 样 的 代码 分 配 一 个 巨大 的 数组 ， 用 于 数值 运算 : 

double *array=mal loc (256 * 256 * sizeof (double)) ; 

malloc) 并 没有 返回 空 指 针 ， 但 是 程序 运行 得 有 些 奇 怪 ， 好 像 改 写 了 某 些 内 
或 者 malloc O) 并 没有 分 配 我 申请 的 那么 多 内 存 。 为 什么 ? 

答 : 注意 256x256 等 于 65 536， 这 在 你 乘 上 sizeof(double) 以 前 就 已 经 不 能 放 入 
16 位 的 int 型 变量 中 了 。 如 果 你 需要 分 配 这 样 大 的 内 存 空 间 ， 可 得 小 心 。 如 果 在 你 
的 机 器 上 size_t(malloc0 接 受 的 类 型 ) 是 32 位 ， 而 int 为 16 位 ， 你 可 以 写 256 * (256 * 
sizeof(double)) 来 避免 这 个 问题 。( 参 见 问 题 3.16。) 否则 ， 必 须 把 数据 结构 分 解 
为 更 小 的 块 ， 或 者 使 用 32 位 的 机 器 或 编译 器 ， 或 者 使 用 某 种 非 标准 的 内 存 分 配 函 


存 


-> 


数 。 参 见 问 题 19.28。 


N 
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问 : 我 的 PC 机 有 8 兆 内 存 。 为 什么 我 只 能 分 配 640K 左 右 的 内 存 ? 

答 : 在 PC 机 兼容 的 分 段 结 构 下 ， 很 难 透明 地 分 配 超过 640K 以 上 的 内 存 ， 尤 其 
是 在 MS-DOS 下 。 

参见 问题 19.28。 


N 
N 
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H: 我 的 应 用 程序 非常 依赖 数据 结构 的 节点 的 动态 分 配 ， 而 malloc/free 的 
代价 成 了 瓶颈 。 我 该 怎么 做 ? 

答 : 一 个 改进 方案 是 将 不 使 用 的 节点 放 入 你 自己 的 释放 列表 中 ， 而 不 是 真正 
调用 free 去 释放 它们 。 如 果 所 有 的 节点 都 一 样 大 ， 这 样 做 尤其 有 了 吸引 力 。〔 如 果 
在 程序 的 内 存 使 用 中 ， 一 种 数据 结构 占有 绝对 多 数 ， 那 么 这 种 方法 效果 很 好 。 但 
是 如 果 释 放 列 表 中 的 内 存 大 多 不 能 用 于 程序 的 其 他 用 途 ， 录 ， 介 束 得 不 偿 失 了 。) 


N 
N 
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H: 我 的 程序 总 是 月 涡 ， 显 然 发 生 在 malloc 内 部 的 菜 个 地 方 。 但 是 我 看 不 出 
哪里 有 问题 。 是 malloc 有 bug 吗 ? 

答 : 很 不 幸 ，malloc 的 内 部 数据 结构 很 容易 被 破坏 ， 而 由 此 引发 的 问题 会 十 
分 棘手 。 最 常见 的 问题 来 源 是 向 malloc 分 配 的 区 域 写 入 比 所 分 配 的 还 多 的 数据 。 
一 个 常见 的 bug 是 用 malloc(strlen(s)) 而 不 是 strlen(s)+1[1]。 其 他 的 问题 还 包括 使 用 
指向 己 经 释放 了 的 内 存 的 指针 (参见 问题 7.24〉 ， 分 配 大 小 为 0 的 对 象 ( 参 见 问题 
11.28) ， 重 分 配 空 指针 (参见 问题 7.34) ， 释 放 未 从 malloc 获 得 的 指针 、 空 指针 
或 者 已 经 释放 的 指针 。 《其 中 有 些 已 经 被 标准 接纳 : 在 兼容 ANSI 的 系统 中 ， 可 以 
安全 地 分 配 大 小 为 0 的 对 象 ， 可 以 重 分 配 或 释放 空 指针 。 但 是 在 较 老 的 实现 中 往 
往 有 各 种 问题 。) 这 些 错误 的 后 果 可 能 会 在 真正 出 错 很 久 以 后 才 显 现 出 来 或 在 不 
相关 的 代码 段 出 现 ， 从 而 导致 诊断 这 些 问题 十 分 困难 。 


多 数 malloc 的 实现 在 这 些 问 题 面前 显得 十 分 脆弱 ， 因 为 它们 直接 在 它们 返回 
的 内 存 旁 边 存储 至 关 重 要 的 内 部 信息 片段 ， 这 些 信息 很 容易 被 用 户 指针 破坏 。 
参见 问题 7.19、7.30、16.9 和 18.2。 


释放 内 在 


用 malloc 分 配 的 内 存 会 一 直 存在 。 它 永远 也 不 会 自动 释放 《除非 你 的 程序 退 
出 。 参 见 问题 28) 如 果 你 的 程序 只 是 暂时 使 用 内 存 ， 它 能 够 也 应 该 通过 调用 free 
回收 。 


72 


问 : 动态 分 配 的 内 存 一 旦 释放 之 后 就 不 能 再 使 用 ， 是 吧 ? 

答 : 是 的 。 有 些 早 期 的 mallocO 文 档 提 到 释放 的 内 存 中 的 内 容 会 “保留 ”， 但 这 
个 欠 考 虑 的 保证 并 不 普遍 ， 而 且 也 不 是 C 标 准 所 要 求 的 。 

几乎 没有 哪个 程序 员 会 有 意 使 用 已 释放 的 内 存 ， 但 是 意外 的 使 用 却 是 常 有 的 
事 。 考 虑 下 面 释 放 单 链表 的 《正确 ) 代码 : 

struct list *listp, *nextp; 

for (listp=base; listp !=NULL; listp=nextp) { 


nextp=l|istp->next; 
free(listp); 
} 
请 注意 如 果 在 循环 表达 式 中 没有 使 用 临时 变量 nextp， 而 使 用 listp=listp- 之 next 
会 产生 什么 恶劣 后 果 。 
参考 资料 : [19, Sec. 7.8.5 p. 167] 
[8, Sec. 7. 10. 3] 
[14, Sec. 4. 10. 3. 2] 
[11, Sec. 16.2 p. 387] 
[22, Sec. 7.10 p. 95] 


7 


H: 为 什么 在 调用 free (之 后 指针 没有 变 空 ? 使 用 《赋值 、 比 较 ) 释放 之 后 
的 指针 有 多 么 不 安全 ? 

答 : 当 你 调用 free0 的 时 候 ， 传 入 的 指针 指向 的 内 存 被 释放 ， 但 调用 函数 的 指 
针 值 可 能 保持 不 变 ， 因 为 C 的 按 值 传 参 的 语义 意味 着 被 调 函 数 永远 不 会 永久 改变 
参数 的 值 。 参 见 问题 4.8。 

严格 地 讲 ， 被 释放 的 指针 值 是 无 效 的 ， 对 它 的 任何 使 用 ， 即 使 没有 解 引用 
《就 是 说 ， 即 便 是 表面 上 无 伤 大 雅 的 赋值 和 比较 ) ， 理 论 上 也 可 能 带 来 问题 。 
《尽管 作为 一 种 实现 质量 的 表现 ， 多 数 实现 都 不 会 对 无 伤 大 雅 的 无 效 指针 使 用 产 
生 例外 ， 但 是 标准 明确 表示 不 能 确保 任何 事情 ， 而 某 些 系统 体系 下 ， 这 样 的 意外 
是 很 容易 出 现 的 。) 

当 程 序 中 反复 分 配 和 释放 指针 的 时 候 ， 通 常 最 好 在 释放 之 后 立即 将 它们 置 为 
NULL， 以 明确 它们 的 状态 。 

参考 资料 : [8, Sec. 7. 10. 3] 

[14, Sec. 3. 2. 2. 3] 
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问 : 当 我 调用 malloc () 为 一 个 函数 的 局 部 指针 分 配 内 存 时 ， 我 还 需要 用 
free() 显 式 地 释放 吗 ? 

答 : 是 的 。 记 住 指针 和 和 它 所 指向 的 东西 是 完全 不 同 的 。 局 部 变量 在 函数 返回 
时 就 会 释放 ， 但 是 在 指针 变量 这 个 问题 上 ， 这 表示 指针 被 释放 ， 而 不 是 它 所 指向 
的 对 象 。 用 malloc() 分 配 的 内 存在 你 显 式 释放 它 之 前 都 会 保留 在 那里 。 一 般 地 ， 每 
一 个 malloc(0 都 必须 有 个 对 应 的 free() 调 用 。 


N 
N 
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问 : 我 在 分 配 一 些 结构 ， 它 们 包含 指向 其 他 动态 分 配 的 对 象 的 指针 。 我 在 释 
放 结 构 的 时 候 ， 还 需要 释放 每 一 个 下 级 指针 吗 ? 

答 : 是 的 。malloc 和 free 函 数 对 结构 声明 或 分 配 内 存 的 内 容 一 无 所 知 ， 尤 其 是 
它们 不 知道 分 配 的 内 存 中 是 否 包含 指向 其 他 分 配 内 存 的 指针 。 一 般 情 况 下 ， 你 必 
须 分别 向 free0 传 入 malloc0 返 回 的 每 一 个 指针 ， 仪 仅 一 次 (如 果 它 的 确 要 被 释放 


的 话 ) 。 

一 个 好 的 经 验 法 是 ， 对 于 程序 中 的 每 一 个 mallocO 调 用 ， 你 都 可 以 找到 一 个 对 
应 的 free0 调 用 以 释放 malloc0O 分 配 的 内 存 。 

参见 问题 7.28。 


7.28 


问 : 我 必须 在 程序 退出 之 前 释放 分 配 的 所 有 内 存 吗 ? 

答 : 你 不 必 这 样 做 。 一 个 真正 的 操作 系统 毫 无 疑问 会 在 程序 退出 的 时 候 回收 
所 有 的 内 存 和 其 他 资源 。〔 严 格 地 讲 ， 疝 操作 系统 返还 内 存 甚至 都 不 是 free 的 任 
务 。) 然而 ， 有 些 个 人 电脑 据 称 不 能 可 靠 地 释放 内 存 ， 除 非 它 在 退出 前 被 释放 ， 
从 ANSIISO C 的 角度 来 看 这 不 过 是 一 个 “实现 的 质量 问题 ”。 

无 论 如 何 ， 显 式 地 释放 所 有 分 配 的 内 存 是 一 种 好 的 实践 一 例如 ， 万 一 程序 
被 改写 成 多 次 执行 其 主要 任务 (可 能 是 在 图 形 用 户 界 面 下 )〉[2]。 男 一 方面 ， 有 些 
程序 〈 如 解释 器 ) 在 它们 退出 之 前 并 不 知道 哪些 内 存 已 经 处 理 完 《〈 即 可 以 释 
WO 。 况 且 ， 既 然 退 出 的 时 候 会 释放 所 有 的 内 存 ， 让 程序 显 式 地 释放 所 有 的 内 存 
显得 不 必要 ， 可 能 代价 昂贵 ， 而 且 很 容易 出 错 。 

参考 资料 : [35, Sec. 4. 10. 3. 2] 

[8, Sec. 7. 10. 3. 2] 
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问 :我 有 个 程序 分 配 了 大 量 的 内 看， 然后 又 释放 了 。 但 是 从 操作 系统 看 ， 内 
存 的 占用 率 却 并 没有 变 回去 。 

答 : 多 数 malloc/free 的 实现 并 不 把 释放 的 内 存 返 回 操作 系统 ， 而 是 留 着 供 同 
一 程序 的 后 续 mallocO 使 用 。 


分 配 内 存 块 的 大 小 


每 一 块 用 malloc 分 配 的 内 存 显 然 都 有 一 个 已 知 的 、 固 定 的 大 小 ， 但 是 一 旦 分 
配 ， 就 不 能 询问 malloc 包 这 个 大 小 到 底 是 多 少 。《〈 首 先 ， 如 果 能 够 询问 ， 那 么 它 


是 该 告诉 请 求 的 大 小 呢 ， 还 是 它 实 际 给 的 更 大 的 大 小 呢 ? ) 


~ 
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a 
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问 : free) 怎么 知道 有 多 少 字 节 需要 释放 ? 

Æ: malloc/free 的 实现 会 在 分 配 的 时 候 记 下 每 一 块 的 大 小 ， 所 以 在 释放 的 时 
候 就 不 必 再 考虑 它 的 大 小 了 。 通常 ， 这 个 大 小 就 记录 在 分 配 的 内 存 块 旁边 ， 
此 ， 对 超出 分 配 内 存 块 边界 的 内 存 哪怕 是 轻微 的 改写 ， 也 会 导致 严重 的 后 果 。 参 
见 问题 7.23。 ) 


N 
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Ee 


么 我 能 否 查 询 malloc 包 ， 以 查 明 可 分 配 的 最 大 块 是 多 大 ? 
答 : 很 遗憾 ， 没 有 标准 的 或 可 移植 的 办 法 。 某 些 编译 器 提供 了 非 标 准 的 扩 


N 


ms 
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: 为 什么 sizeof 不 能 告诉 我 它 所 指 的 内 存 块 的 大 小 ? 
ZX. sizeof 操 作 符 并 不 知道 你 使 用 了 malloc 为 指针 分 配 内 存 ，sizeof 只 能 得 到 
外 针 本 身 的 大 小 。 没 有 什么 可 移植 的 办 法 得 到 malloc 分 配 的 内 存 块 的 大 小 。 


8 = 


其 他 分 配水 数 


多 数 动态 内 存 分 配 都 使 用 malloc 和 free， 但 是 标准 函数 的 完整 集中 还 包括 


realloc 和 calloc。 


7.33 


问 : REAG. 14 中 那样 ) 动态 分 配 数组 之 后 ， 还 能 改变 它 的 大 小 吗 ? 
答 : 是 的 。 这 正 是 realloc 的 用 武之 地 。 要 改变 动态 分 配 数 组 (例如 ， 问 题 
6.14 中 的 dynarray) 的 大 小 ， 可 以 使 用 下 边 的 代码 : 

dynarray=(int *) realloc((void *) dynarray, 20 *sizeof (int)); 

注意 ，realloc 并 不 一 定 能 在 原 地 扩大 [3] 内 存 区 域 。 如 果 能 够 ， 它 就 返回 传 入 
的 指针 而 已 ， 但是， 如 果 它 必须 到 内 存 中 的 其 他 地 方 去 寻找 足够 大 的 连续 空间 ， 
则 它 会 返回 一 个 不 同 的 指针 ， 而 原 有 的 指针 值 会 变 得 不 可 用 。 

如 果 realloc 根 本 就 不 能 找到 足够 的 空间 ， 则 它 会 返回 空 指针 ， 而 原来 分 配 的 
内 存 会 保留 [4 和。 因此 ， 通 常 不 应 该 立即 将 新 指针 赋 给 旧 指 针 。 最 好 使 用 一 个 临时 
指针 : 

#include<stdio. h> 

#include<stdl ib. h> 


int *newarray=(int *) realloc((void *)dynarray, 20 * sizeof (int)); 
if (newarray !=NULL) 
dynarray=newar ray; 
else { 
fprintf(stderr, "Can't reallocate memory\n") ; 
/* dynarray remains allocated */ 
} 
重新 分 配 内 存 的 时 候 ， 如 果 有 其 他 指针 指向 同一 块 内 存 ， 尤 其 要 注意 : 如 果 
realloc 必 须 在 别 的 地 方 安排 新 的 内 存 块 ， 则 其 他 的 指针 也 应 该 相应 地 修改 。 下 边 


是 一 个 假想 的 例子 〈 它 同时 也 忽视 了 malloc 的 返回 值 ) : 
#include<stdio. h> 
#include<stdl ib. h> 
#include<string. h> 
char *p, *p2, *newp; 
int tmpoffset; 


p=mal loc (10) ; 
strcpy (p, "Hello, ") ; /* p is a string */ 
p2=strchr (p, ', |); /* p2 points into that string */ 


tmpoffset=p2 - p; 

newp=real loc (p, 20) ; 

if (newp !=NULL) { 

p=newp; /* p may have moved */ 
p2=pttmpoffset; /* relocate p2 as well */ 
strcpy (p2, ",world!"); 

} 

printf ("%s\n", p); 

像 这 样 根据 侦 移 量 来 重新 计算 指针 是 最 安全 的 。 另 一 种 方法 是 通过 计算 在 
realloc 调 用 前 后 基 指 针 的 差 值 newp - p 来 重 置 指针 ， 但 不 能 保证 正确 ， 因 为 指针 减 
法 的 定义 只 有 当 它 们 指向 相同 的 对 象 时 才 有 效 。 参 见 问 题 7.25 和 7.34。 

参考 资料 : [19, Sec. BS p. 252] 

[35, Sec. 4. 10. 3. 4] 
[8, Sec. 7. 10. 3. 4] 
[11, Sec. 16.3 pp. 387-388] 


7.34 


问 : 向 realloc() 的 第 一 个 参数 传 入 空 指针 合法 吗 ? 你 为 什么 要 这 样 做 ? 

答 : ANSI C 批 准 了 这 种 用 法 《以 及 相关 的 realloc(.…,0) 用 于 释放 ) ， 尽 管 一 些 
早期 的 实现 不 文 持 ， 因 此 可 能 不 完全 可 移植 。 疝 reallocO 传 入 置 空 的 指针 可 以 更 容 
易 地 写 出 自 开 始 (self-starting) 的 递增 分 配 算法 。 


例如 ， 下 边 的 函数 将 任意 长 度 的 行 读 入 动态 分 配 的 内 存 ， 在 必要 的 时 候 它 会 
对 传 入 的 缓冲 区 进行 再 分 配 。 调用 者 必须 在 不 需要 的 时 候 释 放 返 回 的 指针 。) 

#include<stdio. h> 

#include<stdl ib. h> 

/* read a line from fp into malloc'ed memory */ 

/* returns NULL on EOF or error */ 

/* (use feof or ferror to distinguish) */ 

char *agetline (FILE *fp) 

{ 


char *retbuf=NULL; 
size_t nchmax=0; 
register int c; 
size_t nchread=0; 
char *newbuf ; 
whi le ((c=getc (fp) ) !=EOF) { 
if (nchread>=nchmax) { 
nchmax+=20 ; 
if (nchread>=nchmax) { 
free (retbuf) ; 
return NULL; 
} 
newbuf=real loc (retbuf, nchmax+1) ; 
/*+1 for \O */ 
if (newbuf==NULL) { 
free (retbuf) ; 
return NULL; 
} 
retbuf=newbuf ; 
} 
if (c=='\n') 


break; 
retbuf [nchread++]=c; 
} 
if (retbuf !=NULL) { 
retbuf [nchread]='\0' ; 
newbuf=real loc (retbuf, nchread+1) ; 
if (newbuf !=NULL) 
retbuf=newbuf ; 
} 


return retbuf; 

} 
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会 进行 很 多 次 的 重 分 配 。 很 多 程序 员 喜 欢 倍 增 的 重 分 配 ， 如 nchmax *=2。 但 这 样 
显然 就 不 是 很 像 自 开 始 了 ， 而 且 如 果 需 要 分 配 巨大 的 数组 而 内 存 又 有 限 ， 就 会 有 
问题 了 。 

参考 资料 : [35, Sec. 4. 10. 3. 4] 

[8, Sec. 7. 10. 3. 4] 
[11, Sec. 16.3 p. 388] 


7.39 


问 : calloc( malloc O) 有 什么 区 别 ? 应 该 用 哪 一 个 ? 利用 calloc 的 零 填 充 
功能 安全 吗 ? free () 可 以 释放 calloc () 分 配 的 内 存 吗 ， 还 是 需要 一 个 cfree () ? 


答 : calloc(m,n) 本 质 上 等 价 于 


p=malloc(m * n); 
memset (p, 0,m * n); 
除了 参数 个 数 不 同 和 用 零 填 充 之 外 ， 
用 哪个 函数 都 很 方便 。 不 要 太 依 赖 calloc 的 零 填 充 ， 
数据 结构 ， 尤 其 是 有 指针 域 的 时 候 。 bm A 
类 型 


确保 用 0 初始 化 所 有 的 整数 类 型 〈 包 括 用 \0' 初 始 化 字符 类 型 
成 有 用 的 空 指针 值 或 浮 点 零 值 《参见 第 5 章 ) 。 


这 两 个 函数 并 无 其 他 重要 的 区 别 [5]。 
通常 最 好 自己 按 域 初始 化 

是 全 零 填充 ， 它 可 以 
) 。 但 它 不 能 确保 生 


free() 可 以 安全 地 用 来 释放 calloc0 分 配 的 内 存 ， 没 有 标准 的 cfree 函 数 。 
malloc 和 calloc 的 另 一 个 想象 出 来 的 并 不 重要 的 区 别 在 于 分 配 一 个 元 素 还 是 元 
素 的 数组 。 尺 管 calloc 的 两 个 参数 的 调用 形式 表明 它 应 该 用 来 分 配 m 个 n 大 小 的 元 
素 的 数组 ， 但 事实 上 并 没有 这 样 的 要 求 。 用 calloc 来 分 配 一 个 元 素 〈 传 入 一 个 为 1 
的 参数 ) 是 完全 允许 的 。 用 malloc 来 分 配 一 个 数组 也 没有 问题 ， 只 是 需要 自己 计 
算 相 关 的 乘法 。 参 见 问题 6.14 中 的 代码 片段 。〈 结 构 填 充 也 不 是 问题 ， 使 结构 数 
组 正确 工作 的 任何 填充 都 会 被 编译 器 正确 处 理 。 这 可 以 由 sizeof 反 映 出 来 。 参 见 问 
题 2.14。 ) 
参考 资料 : [35, Sec. 4. 10.3 to 4. 10. 3.2] 
[8, Sec. 7.10.3 to 7.10. 3.2] 
[11, Sec. 16.1 p. 386, Sec. 16.2 p. 386] 
[12, Sec. 11 pp. 141-142] 


7.3 


Ml: alloca 是 什么 ? 为 什么 不 提倡 使 用 它 ? 

答 : 在 调用 alloca 的 函数 返回 的 时 候 ， 非 标准 alloca 函 数 所 分 配 的 内 存 会 自动 
释放 。 也 就 是 说 ， 用 alloca 分 配 的 内 存在 某 种 程度 上 局 限于 函数 的 “ 栈 帧 或 上 下 文 
中 。 

alloca 不 有 具 可 移植 性 ， 而 且 在 没有 传统 栈 的 机 器 上 很 难 实现 [61]。 当 它 的 返回 
值 直 接 传 入 男 一 个 函数 时 会 带 来 问题 ， 如 fgets(alloca(100),100,stdin)[7]。 

由 于 这 些 原因 ，alloca 不 合 标准 ， 不 宜 使 用 在 必须 广泛 可 移植 的 程序 中 ， 不 管 
它 可 能 多 么 有 用 。 既 然 C99 支 持 变 长 数组 CVLA) ， 它 可 以 用 来 更 好 地 完成 alloca 
以 前 的 任务 。 

参见 问题 7.26。 

参考 资料 : [14, Sec. 4. 10. 3] 


[11. 一 个 更 微妙 的 bug 是 malloc(strlen(s+1)。P=malloc(sizeof(p)) 也 是 个 常见 的 错误 。 


[21. 同 时 ， 如 果 程 序 不 释放 它 分 配 的 所 有 内 存 ， 内 存 泄漏 检查 工具 也 很 难 检查 出 真 
正 的 内 存 泄 漏 (参见 问题 18.2〉。 


[31. 但 它 可 以 在 原 地 缩小 内 存 区 域 。 


[41. 要 注意 ， 有 些 ANSI 前 的 编译 费 不 是 总 能 在 realloc 失 败 的 时 候 保留 原来 的 空 
间 。 


区 .有 人 认为 ，calloc 的 全 零 填 充 可 以 确保 立即 分 配 。 参 见 问题 7.18。 


[6]. 在 公共 领域 有 一 个 “几乎 可 移植 ”的 alloca 实 现 ， 但 其 作者 声称 这 只 是 个 权宜 之 
计 ， 并 不 推荐 在 新 的 代码 中 使 用 。 


[Z]. 如 果 在 另 一 个 函数 〈 这 里 就 是 fgets) 的 参数 列表 的 准备 过 程 中 ， 在 同一 个 栈 上 
用 alloca 去 分 配 内 存 ， 则 参数 列表 可 能 会 受到 影响 。 


第 8 章 字符 和 字符 串 


C 语 言 没 有 内 建 的 字符 串 类 型 ， 传 统 上 都 是 用 以 \0' 结 束 的 字符 数组 来 表示 字 
符 串 的 。 而 且 ，C 语 言 也 没有 什么 真正 的 字符 类 型 ， 字 符 是 用 它 在 机 器 字符 集中 
的 整数 值 来 表示 的 。 因 为 这 些 表 示 都 暴露 在 外 ， 对 C 程 序 完 全 可 见 ， 所 以 程序 对 
字符 和 字符 串 的 操作 有 大 量 的 控制 。 这 样 的 缺点 就 是 ， 在 某 种 程度 上 ， 程 序 必 须 
努力 控制 : 程序 员 必 须 记 住 一 个 小 整数 是 解释 成 整数 值 还 是 字符 (参见 问题 
8.6) ， 也 必须 正确 维护 包含 字符 串 的 数组 〈 及 为 它们 分 配 的 内 存 块 ) 。 

也 可 参见 问题 13.1 到 13.7。 这 些 问 题 讲 述 了 用 于 字符 串 操 作 的 库 函 数 。 


8.1 


问 : 为 什么 strcat (string, '!') ;不 行 ? 

答 : 字符 和 字符 串 的 区 别 显而易见 ， 而 strcat() 用 于 拼接 字符 串 。 

像 1' 这 样 的 字符 常量 表示 一 个 字符 。 双 引号 之 间 的 字符 串 字 面 量 通 常 表示 多 
个 字符 。 尽 管 像 "IW" 这样 的 字符 串 字 面 量 看 起 来 好 像 只 有 一 个 字符 ， 但 它 实 际 上 包 
含 两 个 字符 : 一 个 是 你 要 求 的 !， 男 一 个 是 用 作 C 中 所 有 字符 串 结 束 符 的 \0。 

C 中 的 字符 用 与 它们 的 字符 集 值 对 应 的 小 整数 表示 ， 参 见 下 边 的 问题 8.6。 字 


符 串 用 字符 数组 表示 ， 通 常 操作 的 是 字符 数组 的 第 一 个 字符 的 指针 。 二 者 永远 不 
能 混用 。 要 为 一 个 字符 串 附 加 !， 需 要 使 用 


strcat (string, "!") ; 
参见 问题 1.34、7.2 和 16.7。 
参考 资料 : [22, Sec. 1.5 pp. 9-10] 


8.2 


问 : 我 想 检查 一 个 字符 囊 是 否 跟 菜 个 值 匹配 。 为 什么 这 样 不 行 ? 


char *string; 


if (str ing=="value") { 


/* string matches "value" */ 


} 

答 : C 语 言 中 的 字符 串 用 字符 的 数组 表示 ，C 语 言 不 会 把 数组 作为 一 个 整体 来 
操作 赋值、 比较 等 ) [1]。 上 面 代 码 段 中 的 == 操 作 符 比 较 的 是 两 个 指针 外 针 
变量 string 的 值 和 字符 串 字 面 量 "value" 的 指针 值 一 一 看 它们 是 否 相 等 ， 也 就 是 
说 ， 看 它们 是 否 指向 同一 个 位 置 。 它 们 可 能 并 不 相等 ， 所 以 比较 绝 不 会 成 功 。 

要 比较 两 个 字符 串 ， 一 般 使 用 库 函 数 strcmp(0): 

if(strcmp (string, "value")==0) { 


/* string matches "value" */ 


H: 如 果 我 可 以 写 

char a[]="Hello,world!"; 

那 为 什么 不 能 写 

char a[14] ; 

a="Hel lo, world!"; 

S. 字符 串 是 数组 ， 而 不 能 直接 对 数组 赋值。 可 以 使 用 strcpy0 代 葵 : 
strcpy (a, "Hello, world!") ; 

参见 问题 1.34、4.2 和 7.2。 


8.4 


问 : 为 什么 我 的 strcat 不 行 ? RA T 


char *s1="Hel lo, "; 


char *s2="world!"; 

char *s3=strcat (s1, s2) ; 
可 得 到 的 结果 很 奇怪 。 

答 : 参见 问题 7.2。 


问 : 这 两 个 初始 化 有 什么 区 别 ? 

char al[]="string literal"; 

char *p="string literal"; 
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答 : 参见 问题 1.34。 


8.6 


问 : 我 怎么 得 到 与 字符 相对 应 的 数字 【《〈 即 ASC11 或 其 他 字符 集 下 的 ) 值 ? A 
过 来 又 该 怎么 做 ? 

答 : 在 C 语 言 中 字符 用 与 它们 的 字符 集 值 对 应 的 小 整数 表示 。 因 此 ， 不 需要 
任何 转换 函数 : 如 果 有 字符 ， 就 有 它 的 值 。 

这 段 代 码 

int c1='A', c2=65; 

printf ("%c %d %c %d\n",c1, 01, C2, c2); 

在 ASCII 机 器 上 会 输出 

A 65 A 65 
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数 '0'"， 即 字符 值 '0'。 

参见 问题 13.1、8.9 和 20.11。 


8.7 


问 : C0 语言 有 类 似 其 他 语言 的 "substr" (提取 子 串 ) HH HRY? 


答 : 参见 问题 13.3。 


8.8 


H: 我 将 用 户 键入 的 字符 串 读 入 数组 ， 然 后 再 显示 出 来 。 当 用 户 键入 \n 这 
样 的 序列 时 ， 为 什么 不 能 正确 处 理 呢 ? 

答 : 这 样 的 字符 序列 是 在 编译 时 解释 的 。 当 反 斜 枉 和 相 邻 的 n 出 现在 字符 第 
量 或 字符 串 字 面 量 中 的 时 候 ， 它 们 立即 被 转换 成 一 个 换行 字符 。 (当然 ， 对 其 他 
的 转 义 字符 序列 也 会 进行 类 似 的 转换 。) 但 是 ， 当 从 用 户 或 者 文件 读 入 字符 串 的 
时 候 ， 并 没有 进行 这 样 的 转换 : 反 斜 枉 和 其 他 的 字符 一 样 被 读 入 和 显示 ， 没 有 进 
行 任何 特别 的 转换 。《 在 运行 时 MO 过 程 中 倒是 有 些 换行 符 会 被 转换 ， 但 那 是 由 于 
完全 不 同 的 原因 。 参 见 问题 12.43。 ) 

参见 问题 12.7。 


8.9 


问 : 我 注意 到 sizeof('a') 是 2 而 不 是 1〈 即 不 是 sizeof (char) ) ， 有 是 不 是 我 
的 编译 器 有 问题 ? 
答 : 可 能 有 些 令 人 吃惊 ， 但 C 语 言 中 的 字符 常量 是 int 型 ， 因 此 sizeof('a) 是 
sizeof(int)， 这 是 男 一 个 与 C++ 不 同 的 地 方 。 参 见 问题 7.12。 
参考 资料 : [35, Sec. 3.1.3. 4] 
[8, Sec. 6. 1. 3. 4] 
[11, Sec. 2. 7. 3 p. 29] 


8.10 


H: 我 正 开始 考虑 多 语言 字符 集 的 问题 。 是 否 有 必要 担心 sizeof (char) 会 被 
定义 为 2， 以 便 表达 16 位 的 字符 集 呢 ? 

E: 就 算 char 型 被 定义 为 16 位 ，sizeof(char) 依 然 是 1， 而 二 limits.h 二 中 的 
CHAR_BIT 会 被 定义 为 16。 届 时 将 不 能 声明 (或 用 malloc 分 配 ) 一 个 8 位 的 对 象 。 

传统 上 ， 一 个 字 节 并 不 一 定 是 8 位 ， 它 不 过 是 一 小 段 内 存 ， 通 党 适 于 存储 一 


个 字符 。C 标 准 遵循 了 这 种 用 法 ， 因 此 malloc 和 sizeof 所 使 用 的 字 节 可 以 是 8 位 以 
上 。[2] (标准 不 允许 低 于 8 位 。) 

为 了 不 用 扩展 char 型 就 能 操作 多 语言 字符 集 ，ANSIISO CENX J“ FK 
型 wchar ft 以 及 对 应 的 宽 字 符 常 量 和 宽 字 符 串 字面 量 ， 同 时 也 提供 了 操作 和 转换 宽 
字符 串 的 函数 。 

参见 问题 7.12。 

参考 资料 : [35, Sec. 2. 2. 1. 2, 3. 13. 4, 4. 1. 5, 4. 10. 7, 4. 10. 8] 

[8, Sec. 5. 2. 1. 2, 6. 13. 4, 7. 1. 5, 7. 10. 7, 7. 10. 8] 

[14, Sec. 2. 2. 1. 2] 

[11, Sec. 2. 7. 3 pp. 29-30, Sec. 2. 7. 4 p. 33, Sec. 11. 1 
p. 293, Secs. 11.7, 11.8 pp. 303-310] 
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[2].8 位 的 字 节 正式 称 为 八 位 字 节 (octet) 。 


BIE 布尔 表达 式 和 变量 


C 语 言 没 有 正式 的 、 内 建 的 布尔 类 型 。 布 尔 值 不 过 是 整数 (但 是 其 范围 大 大 
缩小 了 ! ) ， 因 此 它们 可 以 放 入 任何 整 型 中 。C 语 言 将 0 值 解释 为 假 ， 而 将 任何 非 
零 值 解释 为 真 。 关 系 和 人 逻辑 操作 符 ==、!=、 二 、>、>=、&& 久 和 | 返回 1 表 示 
真 ， 因 此 1 作为 真 值 比 其 他 非 零 值 更 著名 些 〈 但 请 参考 问题 9.2) 。 


9.1 


问 : 0 语言 中 布尔 值 该 用 什么 类 型 ? 为 什么 它 不 是 一 个 标准 类 型 ? 我 应 该 用 
#def ine 或 enum 定 义 真 值 和 假 值 吗 ? 

答 : C 语 言 没 有 提供 标准 的 布尔 类 型 ， 部 分 原因 在 于 选择 一 个 这 样 的 类 型 涉 
及 最 好 由 程序 员 来 决定 的 空间 /时 间 折 中 。 【使 用 int 型 可 能 更 快 ， 而 char 型 可 能 
节省 数据 空间 。[1] 然 而 ， 如 果 需 要 和 int 型 反复 转换 ， 那 么 更 小 的 类 型 也 可 能 生成 
更 大 或 更 慢 的 代码 。) 

可 以 任意 使 用 #qdefine 或 枚 举 常量 定义 真 / 假 ， 无 伤 大 雅 〈 参 见 问题 2.23 和 
17.10) 。 使 用 以 下 任何 一 种 形式 : 


#def ine TRUE 1 #define YES 1 
#def ine FALSE 0 #define NO 0 
enum bool {false, true} ; enum bool {no, yes}; 


或 直接 使 用 1 和 0， 只 要 在 同一 程序 或 项 目 中 保持 一 致 即 可 。 如 果 调 试 器 在 查 
看 变量 的 时 候 能 够 显示 枚 举 常量 的 名 字 ， 可 能 使 用 枚 举 更 好 。 

同样 也 可 以 使 用 typedef: 

typedef int bool; 

或 

typedef char bool; 

或 


typedef enum {false, true} bool; 

有 些 人 更 喜欢 这 样 的 定义 : 

#define TRUE (1==1) 

#define FALSE (!TRUE) 

或 者 定义 这 样 的 “辅助 * 宏 : 

#define Istrue(e) ((e) !=0) 

但 这 样 做 于 事 无 益 ， 参 见 下 边 的 问题 9.2、5.12 和 10.2。 


9.2 


问 : 既然 在 0 语言 中 所 有 的 非 零 值 都 被 看 作 “ 真 ”， 那 是 不 是 把 TRUE 定 义 为 1 
很 危险 ? 如 果菜 个 内 建 的 函数 或 关系 操作 符 “ 返 回 ” 不 是 1 的 其 他 值 怎么 办 ? 

答 : 尽管 C 语 言 中 任何 非 零 值 都 都 被 看 作 真 ， 但 这 仅 限 于 “输入 ”， 也 就 是 
说 ， 仅 限于 需要 布尔 值 的 地 方 。 当 内 建 操作 符 〈 如 ==、!= 和 扫 =) 生成 布尔 值 
时 ， 可 以 保证 为 1 或 0。 因 此 ， 这 样 的 测试 

if ( (a==b) ==TRUE) 

能 如 愿 运行 《只 要 TRUE 为 1) ， 但 这 显然 很 傻 。 事 实 上 ， 跟 TRUE 和 FALSE 
的 直接 比较 都 不 合适 ， 因 为 有 些 库 函 数 〈 如 isupperO0、isalpha0 等 ) 在 成 功 时 返回 
非 零 值 ， 但 不 一 定 为 1。《〈 再 说 ， 如 果 你 认为 “if((a==b)==TRUE)” 比 “if(a==b)” 好 ， 
那 为 什么 就 此 打住 呢 ? 为 什么 不 使 
用 "if(((a==b)==TRUE)==TRUE)” 或 “if((((a==b)==TRUE)==TRUE)==TRUE)” 呢 ? 
也 可 参见 Lewis Carrol 的 文章 “What the Tortoise Said to Achilles”. 

既然 f(a==b) 是 个 完全 合法 的 条 件 表 达 式 ， 那 么 这 也 是 完全 合法 的 : 

#include<ctype. h> 


if (i supper (c) ) 

{...} 

原因 是 已 知 isupper 为 假 / 真 时 返回 零 / 非 零 值 。 类 似 地 ， 这 样 的 代码 也 可 以 放 
心 使 用 : 


int is vegetable; /* really a bool */ 


.. if (is vegetable) 


或 


extern int fileexist(char *); /* returns true / false */ 
. if (fi leexist (outf i le) ) 
{...} 


在 这 些 例子 中 ，isvegetable 和 fileexists() 都 是 “概念 上 的 布尔 型 "*。 这 样 的 写法 

if (isvegetab | e==TRUE) 

或 

if (fileexists (outfile) ==YES) 

实际 并 没有 任何 改进 。【〔 可 以 认为 它们 “更 安全 ”或 “风格 更 好 ”， 也 可 以 认为 
它们 有 风险 或 风格 很 糟 。 反 正 它 们 读 起 来 并 不 那么 顺畅 。 参 见 问题 17.10。 ) 

一 个 很 好 的 经 验 法 则 是 ， 只 有 在 向 布尔 变量 赋值 或 作为 函数 参数 或 作为 布尔 
函数 的 返回 值 的 时 候 使 用 TRUE 和 FALSE (或 类 似 的 宏 ) ， 绝 不 要 在 比较 中 使 
He 

参见 问题 5.3。 

参考 资料 : [18, Sec. 2.6 p. 39, Sec. 2.7 p. 41] 

[19, Sec. 2.6 p.42,Sec.2.7 p.44,Sec.A7.4.7 p.204, Sec. A7.9 
p. 206] 

[8, Sec. 6. 3. 3. 3, Sec. 6. 3. 8, Sec. 6. 3.9, Sec. 6. 3. 13, Sec. 6. 3. 14, 

[11, Sec. 7.5.4 pp. 196-197, Sec. 7.6.4 pp. 207-208, Sec. 7.6.5 
pp. 208-9, Sec. 7. 7 pp. 217-218, 

Sec. 7.8 pp. 218-219, Sec. 8.5 pp. 238-239, Sec. 8.6 pp. 241- 
244] 


9.3 


问 : 当 p 是 指针 时 ，if(p) 是 合法 的 条 件 表达 式 吗 ? 
答 : 是 的 。 参 见 问题 5.3。 


问 : 我 该 使 用 像 TRUE 和 FALSE 这 样 的 符号 名 称 还 是 直接 用 1 和 0 来 作 布 尔 常 
量 ? 

答 : 选择 权 在 你 。 使 用 这 些 预 处 理 宏 是 为 了 提高 代码 的 可 读 性 ， 而 不 是 因为 
它 所 代表 的 值 可 能 改变 。 使 用 符号 名 称 还 是 直接 用 1/0 关 乎 风格 ， 但 不 涉及 对 错 。 
(同样 的 论断 也 适用 于 NULL 宏 。 

参见 问题 5.10 和 17.10。 ) 

一 方面 ， 使 用 符号 名 称 〈 如 TRUE 或 FALSE) 会 提示 读者 使 用 了 布尔 值 。 另 
一 方面 ， 布 尔 值 和 定义 可 能 会 令 人 很 迷惑 ， 有 些 程序 员 觉 得 TRUE 和 FALSE 宏 不 
过 让 这 些 迷惑 变 得 更 加 复杂 而 已 。〈 人 参见 问题 5.9。 ) 


9.5 


问 : 我 准备 使 用 的 一 个 第 三 方 头 文 件 定 义 了 自己 的 TRUE 和 FALSE， 它 们 跟 我 
已 经 开发 的 部 分 不 兼容 。 我 该 怎么 办 ? 
答 : 参见 问题 10.10。 


呈 ]. 位 域 可 能 会 更 紧 炭 ， 参 见 问题 2.27。 需 要 使 用 无 符号 位 域 ， 1 位 的 有 符号 位 域 
不 能 可 移植 地 保存 值 +1。 


第 10 音 C 预 处 理 器 


C 语 言 的 预 处 理 器 为 很 多 软件 工程 和 配置 管理 问题 提供 了 合理 的 解决 方案 ， 
但 它 的 语法 跟 C 语 言 的 其 他 方面 烦 不 相同 。 正 如 它 的 名 称 暗示 的 ， 预 处 理 器 在 正 
式 解析 和 编译 之 前 操作 。 因 为 它 不 知道 编译 器 的 其 他 部 分 所 识别 的 代码 结构 ， 所 
以 它 也 不 能 作出 任何 跟 声 明 的 类 型 和 函数 结构 有 关 的 处 理 。 

本 章 的 前 半 部 分 围绕 主要 的 预 处 理 指令 #define 〈 问 题 10.1 到 10.5) ~ 
#inlcude 《问题 10.6 到 10.11〉 和 ##f( 问 题 10.12 到 10.19〉 展 开 。 问 题 10.20 到 10.25 
包含 了 奇异 的 宏 蔡 换 ， 而 问题 10.26 和 10.27 则 讨论 了 跟 预 处 理 器 缺乏 可 变 长 宏 参 
数列 表 相 关 的 一 些 问题 。 


10.1 


问 : 我 想 定义 一 些 函 数 式 的 安 ， 例 如 : 

#define square(x)x * x 

但 它们 并 不 总 是 正确 的 。 为 什么 ? 

B: 宏 扩 展 是 纯粹 的 文本 扩展 。 为 了 避免 意外 ， 在 定义 函数 式 的 宏 的 时 候 ， 
请 记 住 下 边 所 列 的 三 条 规则 。 

(1) 宏 扩展 必须 使 用 插 号 ， 以 便 保护 表达 式 中 低 优 先 级 的 操作 符 。 例 如 对 于 上 
边 问 题 中 错误 ) 的 square() 宏 ， 调 用 

1 / square (n) 


会 被 扩展 为 
1/n*n 
这 等 价 于 (1 /n)* n。 而 你 需要 的 是 
1/ (n* n) 


在 这 里 ， 问 题 出 在 结合 性 而 不 是 优先 级 上 ， 但 效果 是 一 样 的 。 

(2) 在 宏 定义 内 部 ， 所 有 参数 的 出 现 都 必须 用 括号 括 起 来 ， 以 便 保护 实 参 中 任 
何 低 优先 级 的 操作 符 不 受 宏 扩 展 其 他 部 分 的 影响 。 同 样 以 square() 为 例 ， 调 用 

square (n+1) 

会 被 扩展 为 

n+1 * n+1 

但 你 需要 的 是 

(n+1)* (n+1) 

(3) 如 果 一 个 参数 在 扩展 中 出 现 了 多 次 ， 而 实 参 是 带 副 作用 的 表达 式 ， 则 宏 可 
能 不 能 正确 运行 。 再 以 square0 宏 为 例 ， 调 用 

square (i++) 


会 被 扩展 为 


1 十 十 米 “| 十 十 

而 这 是 未 定义 的 《参见 问题 3.2) 。 

遵循 规则 (1) 和 规则 (2) 的 正确 的 square 宏 的 定义 应 该 是 

#define square (x) ((x)* (x)) 

WES EA EH AHR, eC HA & Ge. [BOR VERE CBS OLA) 
题 3.7) 的 短路 行为 可 以 确保 出 现 多 次 的 参数 只 会 被 求 值 一 次 。 有 时 候 ， 仅 仅 需 要 
在 文档 中 表明 宏 不 安全 ， 从 而 让 用 户 避 人 免 使 用 有 副作用 的 表达 式 作为 实 参 。 其 他 
时 候 ， 如 果 不 能 保证 安全 ， 最 好 不 要 创建 函数 式 的 宏 。 

作为 一 个 风格 传统 ， 宏 名 称 通常 定义 为 首 字 母 大 写 或 所 有 字母 大 写 ， 以 表明 
它们 是 宏 。 如 果 函 数 式 的 宏 的 确 模拟 了 函数 ， 而 且 也 符合 这 三 个 规则 ， 用 全 部 小 
写 的 名 称 也 未 尝 不 可 。 因 为 我 们 讨论 的 square 宏 并 不 满足 这 些 规则 ， 所 以 如 果真 
的 需要 ， 它 应 该 定义 成 这 个 样子 : 

#define Square (x) ((x)* (x)) /* UNSAFE */ 

参考 资料 : [18, Sec. 4.11 p. 87] 

[19, Sec. 4.11.2 p.90] 
[11, Sec. 3. 3. 6, 3.3.7 pp. 49-50] 
[22, Sec. 6.2 pp. 78-90] 


10.2 


问 : 这 里 有 一 些 预 处 理 宏 : 

#define begin { 

#define end } 

使 用 它们 ， 我 可 以 写 出 更 像 Pascal 的 C 代 码 。 你 觉得 怎么 样 ? 

答 : 使 用 这 样 的 宏 ， 虽 然 表 面 看 上 去 很 吸引 人 ， 但 实际 上 并 不 推荐 。 严 重 的 
情况 下 ， 这 种 用 法 被 称 为 “ 预 处 理 器 滥用 ”。 试 图 重 定义 一 种 语言 的 语法 以 适应 个 
人 的 偏好 或 模仿 其 他 的 语言 没有 什么 好 处 。 你 的 偏好 不 大 可 能 被 以 后 的 代码 读者 
或 维护 者 共享 ， 而 对 其 他 语言 的 任何 模拟 也 难以 完美 (宣称 的 方便 和 效用 您 怕 还 
FRA EWE EPRI.) 

作为 一 条 一 般 规 则 ， 让 预 处 理 宏 遵守 C 语 言 的 语法 规则 是 个 好 主意 。 没 有 参 
数 的 宏 应 该 看 起 来 像 变量 或 其 他 标识 符 ， 有 参数 的 宏 应 该 像 函数 调 用 。 问 自己 这 


样 的 问题 : “如 果 我 不 经 过 预 处 理 就 让 编译 器 编译 ， 这 段 代码 会 产生 多 少 语法 错 
误 ? ”( 当 然 ， 你 会 得 到 很 多 未 定义 标识 符 和 非常 数 的 数组 维度 ， 但 这 些 不 是 语法 
音 误 。) 这 条 规则 意味 着 ， 加 上 宏 调 用 的 C 代 码 看 起 来 还 应 该 是 C 代 码 。 所 谓 的 非 
语法 宏 ， 如 begin 和 end 或 者 CTRL(D)( 参 见 问题 10.21) ， 只 会 让 C 代 码 看 着 像 官 
样 文章 一 样 〈 参 见 问题 20.42) 。 当 然 ， 这 很 大 程度 上 是 个 风格 问题 。 参 见 第 17 


二 


草 。 


10.3 


问 : 怎么 写 一 个 交换 两 个 值 的 通用 宏 ? 

E, 对 于 这 个 问题 没有 什么 好 的 答案 。 如 果 这 两 个 值 是 整数 ,可 以 使 用 异 或 的 
技术 ， 但 是 这 对 浮 点 值 或 指针 却 不 行 ， 对 两 个 值 是 同一 个 变量 也 无 能 为 力 。 (GE 
见 问题 3.4 和 20.18。) 如 果 和 希望 这 个 宏 用 于 任何 类 型 的 值 〈 通 党 的 目标 ) ， 那 么 
任何 使 用 临时 变量 的 解决 方案 都 有 问题 ， 下 面 列 出 了 原因 。 

很 难 找到 一 个 不 跟 其 他 名 称 冲突 的 临时 变量 名 称 。 你 所 选择 的 任何 名 称 都 有 
可 能 正巧 是 需要 交换 的 变量 之 一 的 名 称 。 可 以 用 在 拼接 两 个 实 参 的 名 称 ， 以 确保 
跟 任何 一 个 都 不 相同 ， 但 是 如 果 拼 接 成 的 名 称 大 于 31 个 字符 [1]， 它 还 是 可 能 不 唯 
一 ， 而 且 也 不 允许 交换 非 简单 标识 符 “〈 如 afij) 。 可 能 可 以 使 用 像 tmp 这 样 处 于 用 
户 和 实现 命名 空间 之 间 的 “无 人 地 带 ” 的 名 称 。 参 见 问题 1.30。 

要 么 这 个 临时 变量 不 能 声明 为 正确 的 类 型 (因为 标准 C 没 有 提供 typeof 操 作 
符 ) ， 要 么 (如 果 它 使 用 memcpy 按 字 节 将 对 象 复 制 到 sizeof 计 算出 来 的 临时 数 
2H) 这 个 宏 就 不 能 用 于 声明 为 register 的 操作 数 。 

最 好 的 全 面 解决 方案 可 能 就 是 忘掉 宏 这 回 事 ， 除 非 你 还 准备 把 类 型 作为 第 三 
个 参数 传 入 。【〔 而 且 ， 如 果 准 备 交 换 整 个 结构 或 数组 ， 可 能 交换 指针 会 更 好 。) 

如 果 你 被 一 劳 永 逸 地 解决 这 个 问题 的 热切 愿望 所 吸引 ， 你 芍 怕 需要 三 思 ， 因 
为 还 有 更 值得 付出 宝贵 精力 的 其 他 问题 。 


10.4 


问 : 书写 多 语句 宏 的 最 好 方法 是 什么 ? 
答 : 通常 的 目标 是 能 够 像 一 个 包含 函数 调用 的 表达 式 语句 一 样 调用 宏 : 


MACRO (arg, arg2) ; 

这 意味 着 “调用 者 ”需要 提供 最 终 的 分 号 ， 而 宏 体 则 不 需要 。 因 此 宏 体 不 能 大 
简单 的 括号 包围 的 复合 语句 ， 因 为 这 个 宏 可 能 会 用 于 带 else 分 支 的 if/else 语 句 的 并 
分 支 : 

if (cond) 

MACRO (arg1, arg2) ; 

else /* some other code */ 

如 果 宏 扩展 为 一 个 简单 的 复合 语句 ， 则 用 户 提 供 的 最 终 的 分 号 就 会 成 为 语法 
H0 
HR: 

i f (cond) 

{stmt1; stmt2;}; 


else /* some other code */ 


所 以 ， 传 统 的 解决 方 膝 就 是 这 样 : 


#define MACRO (arg1, arg2)do { \ 
/* declarations */ \ 
stmt1; \ 
stmt2; \ 
/* ...*/ \ 
} while (0) /* (no trailing; )*/ 


当 调 用 者 加 上 分 号 后 ， 宏 在 任何 情况 下 都 会 扩展 为 一 个 语句 。 优 化 的 编译 
句 会 去 挥 条 件 为 0 的 “无 效 ” 测 试 或 分 支 ， 而 lint 可 能 会 警告 。) 
男 一 种 可 能 的 方案 是 : 


#def ine MACRO (arg1, arg2) if (1) { \ 
stmt1; \ 
stmt2; \ 
} else 


ERARA, BARA aes SEA ES, CMRR 
悄悄 地 破坏 周围 的 代码 。 

如 果 宏 体内 的 语句 都 是 简单 语句 ， 没 有 声明 或 循环 ， 那 么 还 有 一 种 技术 ， 就 
是 写 一 个 使 用 一 个 或 多 个 辟 号 操作 符 的 表达 式 ， 放 在 括号 中 : 


#def ine FUNC (arg1, arg2) (expr1, expr2, expr3) 
问题 10.26 的 第 一 个 DEBUG0O 宏 就 是 一 个 例子 。 这 种 技术 还 可 以 “返回 ”一 个 值 
(这 里 就 是 expr3) o 
有 些 编译 器 ， 如 gcc， 可 以 使 用 非 标准 的 “inline” 关 键 字 或 其 他 扩展 自动 地 或 
根据 程序 员 的 请 求 内 联 扩展 小 函数 。 
参考 资料 : [11, Sec. 3. 3.2 p. 45] 
[22, Sec. 6.3 pp. 82-83] 


10.5 


问 : 用 typdef 和 预 处 理 宏 生 成 用 户 定义 类 型 有 什么 区 别 ? 
答 : 参见 问题 1.13。 


10.6 


问 : 我 第 一 次 把 一 个 程序 分 成 多 个 源 文件 ， 我 不 知道 该 把 什么 放 到 . c 文 件 ， 
把 什么 放 到 .h 文 件 。 (“.h” 到 底 是 什么 意思 ? ) 

B: 作为 一 般 规 则 ， 应 该 把 下 面 所 列 的 内 容 放 入 头 (.b) 文 件 中 : 

宏 定义 〈 预 处 理 #define》; 

结构 、 联 合 和 枚 举 声 明 ; 


typedef HH ; 
外 部 函数 声明 〈 参 见 问题 1.11) ; 
全 局 变量 声明 。 


当 声 明 或 定义 需要 在 多 个 文件 中 共享 时 ， 把 它们 放 入 一 个 头 文件 中 尤其 重 
要 。 不 要 在 两 个 或 多 个 源 文件 的 顶部 重复 声明 或 定义 宏 。 应 该 把 它们 放 入 一 个 头 
文件 ， 然 后 在 需要 的 时 候 用 ##include 包 含 进来 。 这 样 做 的 原因 并 不 仅仅 是 减少 打字 
输入 一 一 这 样 可 以 保证 在 声明 或 定义 变化 的 时 候 ， 只 需要 修改 一 处 即 可 将 结果 一 
致 地 传播 到 各 个 源 文件 中 。 (特别 是 ， 永 远 不 要 把 外 部 函数 原型 放 到 .c 文 件 中 。 
参见 问题 1.7。) 

另 一 方面 ， 如 果 定 义 或 声明 为 一 个 源 文 件 私 有 ， 则 最 好 留 在 该 文件 中 。〔 作 
用 域 限 于 单 文 件 的 私有 函数 和 变量 应 该 声明 为 static。 参 见 问题 2.4。) 

最 后 ， 不 能 把 实际 的 代码 (如 函数 体 ) 或 全 局 变量 定义 〈 即 定义 和 初始 化 实 
例 ) 放 入 头 文件 中 。 而 且 ， 当 用 多 个 源 文件 创建 一 个 项 目的 时 候 ， 应 该 单独 编译 
每 个 文件 (使 用 特定 的 编译 选项 ， 只 进行 编译 ) ， 然 后 用 连接 器 将 生成 的 目标 文 
件 连接 起 来 。《〈 如 果 是 集成 开发 环境 ， 这 些 事情 可 能 已 经 不 用 你 自己 操心 了 。 ) 
不 要 试图 用 贡 nclude 把 你 的 源 文 件 * 连 接 ” 成 一 个 整体 。 划 nclude 是 用 来 引入 头 文件 
而 不 是 .c 文 件 的 。 

参见 问题 1.7、10.7 和 17.2。 

参考 资料 : [19, Sec. 4.5 pp. 81-82] 


[11, Sec. 9.2.3 p. 267] 
[22, Sec. 4.6 pp. 66-67] 


10.7 


H: 可 以 在 一 个 头 文 件 中 包 人 金 另 一 头 文件 吗 ? 

答 : 这 是 个 风格 问题 ， 因 此 有 不 少 的 和 争论。 很 多 人 认为 " 奶 套 包含 文件 "应 该 
避免 ， 盛 名 远 播 的 “印第安 山 风格 指南 ”(Indian Hill Style Guide， 人 参见 问题 17.9) 
PER DBL. CE LEASE EEF. URES SK, ESR 
重复 定义 错误 ， 同 时 它 也 会 令 Makefile 的 人 工 维护 十 分 困难 。 

但 另 一 方面 ， 和 伦 套 包含 文件 使 模块 化 使 用 头 文件 成 为 一 种 可 能 《一 个 头 文件 
可 以 包含 它 所 需要 的 一 切 ， 而 不 是 让 每 个 源 文 件 都 包含 需要 的 头 文 件 ) 。 类 似 
grep 的 工具 (或 tags 文 件 ) 使 搜索 定义 十 分 容易 ， 无 论 它 在 哪里 。 一 种 流行 的 头 文 
件 定义 技巧 是 : 

#ifndef HFILENAME_ USED 

#define HFILENAME_ USED 

. RIHAR ... 

#endi f 

每 一 个 头 文件 都 使 用 了 一 个 独一无二 的 宏 名 。 这 令 头 文件 可 自我 识别 ， 以 便 
可 以 被 安全 地 多 次 包含 。 而 自动 的 Makefile 维 护 工 具 (无 论 如 何 ， 在 大 型 项 目 中 
都 是 必 不 可 少 的 。 参 见 问题 18.1) 可 以 很 容易 地 处 理 拒 套 包 含 文件 的 依赖 问题 。 

参见 问题 17.10。 

参考 资料 : [14, Sec. 4. 1.2] 


10.8 


问 : 完整 的 头 文件 搜索 规则 是 怎样 的 ? 

答 :准确 的 行为 是 由 实现 定义 的 。 (这 也 意味 着 应 该 有 文档 说 明 。 参 见 问题 
11.35。) 通常 ， 用 二 > 命名 的 头 文件 会 先 在 一 个 或 多 个 标准 位 置 搜索 ，[2] 用 "… 命 
名 的 头 文件 会 首先 在 “当前 目录 ”搜索 ， 然 后 (如 果 没有 找到 ) 再 在 标准 位 置 搜 
Ro (标准 只 规定 了 用 "命名 的 文件 也 会 按照 < > 文件 的 方式 搜索 。) 


Fy DK AE FSC 5 BT oe HE Mo FESR COT AE FEUNIX YE 
下 〉， 当 前 目录 是 包含 #include 指 令 的 文件 所 在 的 目录 。 而 在 其 他 编译 器 下 ， 当 前 
目录 是 编译 器 启动 的 目录 。 (没有 目录 或 没有 当前 目录 概念 的 系统 下 的 编译 器 当 
然 还 有 可 能 使 用 其 他 的 规则 。) 使 用 某 种 方法 辣 标 准 位 置 的 搜索 列表 增加 其 他 的 
目录 “通常 是 一 个 包含 大 写 I 的 命令 行 参数 或 菏 个 环境 变量 ) 也 是 很 常见 的 。 参 考 
你 的 编译 器 文档 。 
参考 资料 : [19,Sec.A12.4 p.231] 
[35,Sec.3.8.2] 
[8,Sec.6.8.2] 
[11,Sec.3.4 p.55] 


jà 
© 


H: 我 在 文件 的 第 一 个 声明 就 遇 到 奇怪 的 语法 错误 ， 但 是 看 上 去 没什么 问 


答 : 可 能 你 包含 的 最 后 一 个 头 文 件 的 最 后 一 行 缺 一 个 分 号 。 参 见 问题 2.19、 
11.31 和 16.2 。 


10.10 


问 : 我 使 用 了 来 自 两 个 不 同 的 第 三 方 库 的 头 文 件 ， 它 们 都 定义 了 相同 的 宏 ， 
如 TRUE、FALSE、Min() 和 Max () 等 ， 但 是 它们 的 定义 相互 冲突 ， 而 且 跟 我 在 自己 
的 头 文件 中 的 定义 也 有 冲突 。 我 该 怎么 办 ? 

答 : 这 的 确 是 个 讨厌 的 事情 。 这 是 个 典型 的 命名 空间 问题 。 参 见 问题 1.9 和 
1.30。 理 想 状 态 下 ， 第 三 方 库 的 广 商 在 定义 符号 〈 预 处 理 宏 、 全 局 变量 和 函数 名 
称 〉 的 时 候 应 该 尽责 地 确保 不 会 发 生命 名 空间 冲突 。 最 好 的 解决 方案 是 让 厂 丙 修 
改 他 们 的 头 文件 。 作 为 一 种 迁 回 措施 ， 有 时 你 也 可 以 在 发 生 冲 突 的 好 nclude 指 令 之 
间 解 除 或 重新 定义 冲突 的 宏 。 


问 : 我 在 编译 一 个 程序 ， 看 起 来 我 好 像 缺 少 需要 的 一 个 或 多 个 头 文件 。 谁 能 
发 给 我 一 份 ? 

答 : 根据 “缺少 的 ? 头 文 件 的 种 类 ， 有 几 种 情况 。 

如 果 缺 少 的 头 文件 是 标准 头 文 件 〈 即 由 ANSI C 标 准 定义 的 头 文 件 ， 如 去 
stdioh>) ， 那 么 你 的 编译 器 有 问题 。 可 能 编译 器 没有 正确 安装 ， 也 可 能 你 的 项 
目 没 有 配置 好 以 找到 标准 头 文 件 。 你 得 向 你 的 厂商 或 者 精通 你 的 编译 器 的 人 求 
助 。 

如 果 缺少 的 是 ) 非 标准 的 头 文 件 ， 则 问题 更 复杂 一 些 。 有 些 头 文 件 ( 如 < 
dosh>) 完全 是 系统 或 编译 器 特有 的 。 某 些 是 完全 没有 必要 的 ， 而 且 应 该 用 它们 
的 标准 等 价 物 代 替 。 例 如 ， 用 <stdlib.h> 代 替 二 malloch>。 其 他 的 头 文件 ， 如 跟 
流行 的 附加 库 相 关 的 ， 则 可 能 有 相当 的 可 移植 性 。 

标准 头 文件 存在 的 部 分 原因 就 是 提供 适合 你 的 编译 器 、 操 作 系 统 和 处 理 器 的 
定义 。 你 不 能 从 别人 那里 随便 复制 一 份 就 指望 它 能 工作 ， 除 非 这 个 人 跟 你 使 用 的 
是 同样 的 环境 。 你 可 能 事实 上 有 移植 性 问题 (参见 第 19 章 ) 或 者 编译 器 问题 。 否 
则 ， 参 见 问题 18.20。 


问 : 怎样 构造 比较 字符 囊 的 #if 预 处 理 表 达 式 ? 

答 : 你 不 能 直接 这 样 做 ，##f 预 处 理 指 令 只 处 理 整 数 。 有 一 种 蔡 代 的 方法 是 定 
义 几 个 整数 值 不 一 样 的 宏 ， 用 它们 来 实现 条 件 比 较 。 

#def ine RED 1 

#def ine BLUE 2 

#def ine GREEN 

#if COLOR==RED 

/* red case */ 

#else 

#if COLOR==BLUE 

/* blue case */ 

#else 

#if COLOR==GREEN 


/* green case */ 


#else 
/* default case */ 
#endif 
#endif 
#endif 
(标准 C 定 义 了 一 个 新 的 #elif 指 令 ， 可 以 让 if/else 链 看 起 来 更 清楚 一 些 。) 参 
见 问题 20.20。 
参考 资料 : [19, Sec. 4. 11.3 p.91] 
[35, Sec. 3. 8. 1] 
[8, Sec. 6.8. 1] 


[11, Sec. 7.11.1 p. 225] 
10.13 


问 : sizeof 操 作 符 可 以 用 在 #if 预 处 理 指令 中 吗 ? 
答 : 不 行 。 预 处 理 在 编译 过 程 之 前 进行 ， 此 时 尚未 对 类 型 名 称 进行 分 析 。 作 
为 蔡 代 ， 可 以 考 上 外 使 用 ANSI 的 二 limits.h 二 中 定义 的 常量 ， 或 者 使 用 “ 配 
置 ”(configure〉 脚 本。 当然 ， 更 好 的 办 法 是 编写 与 类 型 大 小 无 关 的 代码 。 参 见 问 
题 1.1 和 1.3。 
参考 资料 : [35,Sec.2.1.1.2,3.8.1,footnote 83] 
[8,Sec.5.1.1.2,6.8.1] 
[11,Sec.7.11.1 p.225] 


10.14 


问 : 我 可 以 像 这 样 在 #define 行 里 使 用 #ifdef 来 定义 两 个 不 同 的 东西 吗 ? 
#define ab \ 
#ifdef whatever 

cd 
#else 

efg 
#endif 
答 : 不 行 。 不 能 “让 预 处 理 器 自己 运行 "?。 你 能 做 的 就 是 根据 ##fdef 设 置 使 用 两 

个 完全 不 同 的 #define 行 中 的 一 个 。 
#ifdef whatever 
#define abcd 
#else 
#define a b e f g 
#endif 
参考 资料 : [35, Sec. 3.8. 3, Sec. 3. 8.3.4] 
[8, Sec. 6. 8. 3, Sec. 6.8. 3. 4] 


[11, Sec. 3.2 pp. 40-41] 
10.15 


问 : 对 typedef 的 类 型 定义 有 没有 类 似 #ifdef 的 东西 ? 
答 : 很 遗憾 ， 没 有 。 “也 不 会 有 ， 因 为 类 型 和 typedef 不 能 在 预 处 理 的 时 候 解 
析 。) 可 以 保存 一 套 预 处 理 宏 (如 MY_TYPE_DEFINED) 来 记录 某 个 类 型 是 否 用 
typdef 声 明了 。 参 见 问题 1.13 和 10.13。 
参考 资料 : [35,Sec.2.1.1.2,Sec.3.8.1 footnote 83] 
[8,Sec.5.1.1.2,Sec.6.8.1] 
[11,Sec.7.11.1 p.225] 


10.16 


问 : 我 如 何 用 #if 表 达 式 来 判断 机 器 是 高 字 节 在 前 还 是 低 字 节 在 前 ? 

答 : 恐怕 不 能 。 判 断 机 器 字 节 顺序 的 代码 技术 通常 都 要 使 用 char 型 数组 或 者 
联合 ， 但 预 处 理 运算 仅仅 使 用 长 整 型 ， 而 且 没 有 寻 址 的 概念 。 况 且 ， 在 预 处 理 #f 
表达 式 中 使 用 的 整数 格式 也 不 一 定 跟 运行 时 的 一 样 。 

你 是 否 真 的 需要 明确 机 器 的 字 节 顺序 呢 ? 通常 写 出 与 字 节 顺序 无 关 的 代码 更 
好 《参见 问题 12.45 中 的 代码 片段 ) 。 也 可 参见 问题 20.9。 

参考 资料 : [35, Sec. 3. 8.1] 

[8, Sec. 6.8.1] 
[11, Sec. 7.11.1 p. 225] 


10.17 


H: 为 什么 在 我 用 #ifdef 关 掉 的 代码 行 中 报 出 了 奇怪 的 语法 错误 ? 


答 : 参见 问题 11.21。 


问 : 我 拿 到 了 一 些 代码 ， 里 边 有 太 多 的 #ifdef。 我 不 想 使 用 预 处 理 器 把 所 有 
的 #include 和 #ifdef 都 扩展 开 ， 有 什么 办 法 只 保留 一 种 条 件 的 代码 呢 ? 

答 : 有 几 个 程序 unifdef、rmifdef 和 scpp (selective C preprocessor) 正 是 完成 
这 种 工作 的 。 参 见 问 题 18.20。 


问 : 如 何 列 出 所 有 的 预定 义 宏 ? 

答 : 尽管 这 是 种 常见 的 需求 ， 但 却 没 有 什么 标准 的 办 法 。gcc 提 供 了 和 -FE 一 起 
使 用 的 -dM 选项 ， 其 他 编译 器 也 有 类 似 的 选项 。 如 果 编 译 器 文档 没有 帮助 ， 那 么 
可 以 使 用 类 似 UNIX strings 的 实用 程序 取出 编译 器 或 预 处 理 生成 的 可 执行 文件 中 的 
可 打印 字符 串 。 请 注意 ， 很 多 传统 的 系统 相关 的 预定 义 标识 符 〈 如 “unix”) 并 不 
标准 《因为 和 用 户 的 命名 空间 冲突 ) ， 因 而 会 被 删除 或 改名 。《 无 论 如 何 ， 尽 量 
少 地 使 用 条 件 编 译 是 明智 之 举 。) 


哥 寞 的 处 理 


宏 蔡 换 可 能 非常 复杂 一 一 有 时 候 简 直 就 是 太 复 杂 了 。 对 以 前 偶然 能 使 用 《〈 如 
果真 的 能 的 话 ) 的 两 种 流行 技巧 ， 即 “符号 粘贴 ”(token pasting) 和 字符 串 字 面 量 
AAEH, ANSI C 都 引入 了 明确 定义 的 文 持 机 制 。 


10.20 


问 : 我 有 些 旧 代码 ， 试 图 用 这 样 的 宏 来 构造 标识 符 : 
#define Paste (a, b) a/**/b 
但 是 现在 不 行 了 。 为 什么 ? 
答 : 这 个 宏 只 是 碰巧 能 用 。 这 是 一 些 早期 预 处 理 器 实现 〈 如 Reiser) 的 未 公 
开 的 功能 ， 定 义 中 的 注释 会 完全 消失 ， 因 而 可 以 用 来 粘贴 标识 符 。 但 ANSI 确 认 
(如 K&R1 所 言 〉 用 空白 代 蔡 注释 ， 因 此 它们 不 能 在 Pascal(0) 宏 中 可 移植 地 使 用 。 
然而 对 粘贴 标识 符 的 需求 却 十 分 自然 和 广泛 ， 因 此 ANSI 引 入 了 一 个 明确 定义 的 符 
号 粘贴 操作 符 一 一 检 , 它 可 以 这 样 使 用 : 
#define Paste (a, b) a##b 
在 ANSI 前 的 编译 器 中 ， 你 还 可 以 试 试 这 种 粘贴 标识 符 的 方法 : 
#define XPaste(s)s 
#define XPaste (a, b) XPasete (a) b 
参见 问题 11.19。 
参考 资料 : [35, Sec. 3. 8. 3.3] 
[8, Sec. 6. 8. 3. 3] 
[14, Sec. 3. 8. 3. 3] 
[11, Sec. 3.3.9 p. 52] 


10.21 


H: 我 有 一 个 旧 宏 : 

#define CTRL (c) ('c' & 037) 

现在 不 能 用 了 。 为 什么 ? 

答 : 这 个 宏 在 代码 中 的 使 用 是 这 样 的 : 

tchars. t_eofc=CTRL (D) ; 

基于 “参数 c 的 真实 值 即 使 在 单 引 号 引起 来 的 字符 常量 中 也 会 被 蔡 换 ”这 个 假 
设 ， 这 行 可 望 被 扩展 为 : 

tchars. t_eofc=('D' & 037) ;但 预 处 理 器 从 来 都 没有 设计 成 这 样 工作 ， 
CTRL () 这 样 的 宏 能 工作 不 过 是 个 意外 。ANS1 C 定 义 了 一 个 新 的 “字符 串 化 ”操作 
符 ， 但 并 没有 对 应 的 “字符 化 ”操作 符 。 

这 个 问题 最 好 的 解决 方案 可 能 是 去 掉 宏 定义 中 的 单 引号 ， 将 宏 写成 : 

#define CTRL (c) ((c) & 037) 

然后 在 调用 宏 的 时 候 带 上 单 引号 : 

CTRL ('D') 

这 样 做 也 让 这 个 宏 “ 合 乎 语法 ”了 。 参 见 问 题 10.2. 

也 可 以 使 用 字符 串 化 操作 符 和 一 些 间接 Cindirection) : 

#define CTRL (c) (tHe & 037) 

ft 

#def ine CTRL (c) (#c[0] & 037) 

但 是 ， 这 两 种 都 不 如 原来 的 好 ， 因 为 它们 不 能 用 作 case 行 标 ， 也 不 能 用 来 初 
始 化 全 局 变量 。 “全 局 变量 的 初始 化 和 case 行 标 需要 某 种 特殊 的 常量 表达 式 ， 而 
不 允许 字符 串 字 面 量 和 间接 。) 

参见 问题 11.20。 

参考 资料 : [35, Sec. 3. 8.3 footnote 87] 

[8, Sec. 6.8.3 ] 
[11, Sec. 7. 11. 2, 7. 11. 3 pp. 226-227] 


10.22 


问 : 为 什么 宏 
#define TRACE (n) printf ("TRACE: \%d\n", n) 


报 出 警告 “macro replacement within a string literal” ? 它 似乎 把 
TRACE (count) ;扩展 成 了 

printf ("TRACE: \%d\count", count) ; 

答 : 参见 问题 11.20。 


10.23 


问 : 如 何在 宏 扩 展 的 字符 串 字 面 量 中 使 用 宏 参 数 ? 
答 : 参见 问题 11.20。 


10.24 


H: 我 想 用 ANS1 的 “字符 串 化 ” 预 处 理 操 作 符 # 将 符号 常量 的 值 放 入 消息 
中 ， 但 它 总 是 对 宏 名 称 而 不 是 它 的 值 进 行 字符 串 化 。 这 是 什么 原因 ? 
答 : 参见 问题 11.19。 


10.25 


H: 我 想 用 预 处 理 器 做 某 件 事情 ， 但 却 不 知道 如 何 下 手 。 

答 : C 的 预 处 理 器 并 不 是 一 个 全 能 的 工具 。 注 意 ， 甚 至 都 不 能 保证 它 是 一 个 
单独 的 可 运行 的 程序 。 与 其 强迫 它 做 一 些 不 适当 的 事情 ， 还 不 如 考虑 自己 写 一 个 
专用 的 预 处 理工 具 。 可 以 很 容易 就 得 到 一 个 类 似 make 那 样 的 实用 程序 帮助 你 自动 
运行 。 

如 果 你 要 处 理 的 不 是 C 程 序 ， 可 以 考虑 使 用 一 个 多 用 途 的 预 处 理 器 。 在 多 
数 UNIX 系 统 上 都 可 用 的 一 个 较 老 的 预 处 理 器 是 m4。) 


可 变 参 数列 表 的 宏 


让 函数 接受 可 变 参数 是 由 有 道理 的 《典型 的 例子 是 ”printf。 人 参见 第 15 章 ) 。 
基于 同样 的 理由 ， 有 时 候 也 希望 函数 式 的 宏 可 以 接受 可 变 参数 。 有 个 特别 的 想法 
就 是 希望 写 出 类 似 printf 那 样 的 通用 DEBUGO 宏 。 


10.26 
H: 怎样 写 可 变 参数 宏 ? 如 何 用 预 处 理 器 “ 关 掉 ”具有 可 变 参 数 的 函数 调 


答 : 一 种 流行 的 技巧 是 用 一 个 用 括号 括 起 来 的 “参数 ”定义 和 调用 宏 ， 参 数 在 
宏 扩 展 的 时 候 成 为 类 似 printfO 那 样 的 函数 的 整个 参数 列表 。 

#define DEBUG (args) (printf ("DEBUG: "),printf args) 

if (n !=0)DEBUG(("n is %d\n", n)) ; 

明显 的 缺陷 是 调用 者 必须 记 住 使 用 一 对 额外 的 括号 。 另 一 个 问题 是 宏 扩展 不 
能 放 入 其 他 的 参数 就 是 说 ，DEBUG() 宏 不 能 扩展 成 类 似 fprintf(debugd,.…) 的 形 
Ste 

GNU ”CC 编 译 器 有 一 个 扩展 ， 可 以 让 函数 式 的 宏 接 受 可 变 参数 。 但 这 不 是 标 
准 。 下 面 列 出 了 其 他 可 能 的 解决 方案 。 

根据 参数 的 数量 使 用 不 同 的 宏 (DEBUG1、DEBUG2 等 ) 。 

用 逗号 玩 个 这 样 的 花招 : 

#define DEBUG (args) (printf ("DEBUG: "), printf (args)) 

#define _ 

DEBUG ("i=%d" _ i); 

用 不 匹配 的 括号 玩弄 可 怕 的 花招 : 

#define DEBUG fprintf(stderr， 

DEBUG %d, x) ; 

《这 些 方法 都 需要 使 用 者 小 心 对 待 ， 而 且 它 们 都 丑陋 不 堪 。) [3] 


最 后 ， 你 总 是 可 以 使 用 真实 的 函数 ， 接 受 定义 明确 的 可 变 参数 。 人 参见 问 题 
15.4 和 15.5。 如 果 你 想 关 掉 调试 输出 ， 可 以 使 用 调试 宏 的 男 一 个 版 本 : 

#def ine printf myprintf 

徊 使 用 真正 的 函数 调用 ， 还 是 可 以 用 更 多 的 预 处 理 技巧 去 掉 函 数 名 称 但 保留 
参数 。 例 如 : 

#define DEBUG (void) 

或 

#define DEBUG if(1) {} else printf 

或 

#define DEBUG 1 ? 0 : (void) 

这 些 技巧 都 基于 这 样 一 种 假设 ， 即 一 个 好 的 优化 程序 会 去 掉 所 有 的 “ 死 ”printf 
调用 或 者 让 转换 为 void 的 闪 括 号 的 逗号 表达 式 退 化 。 参 见 问 题 10.14。 

参考 资料 : [9, Sec. 6. 8. 3, Sec. 6.8.3.1] 


10.27 


P: 如 何在 通用 的 调试 宏 中 包含 _FILE_ _ 和 _LINE_ _ 宏 ? 

答 : 这 个 问题 可 以 最 终归 结 为 问题 10.26。 一 种 方案 是 将 你 的 调试 宏 写 成 变 参 
函数 〈 人 参见 问题 15.4 和 15.5) 和 用 静态 变量 隐藏 _FILE _ 和 _ _LINE__ 宏 的 辅助 
函数 ， 例 如 : 

#include<stdio. h> 

#include<stdarg. h> 


void debug (const char *,...); 

void dbginfo(int, const char *) ; 

#define DEBUG dbginfo( LINE ; FILE ),debug static char 
*dbgfile; 


static int dbgline; 
void dgbinfo(int line, const char *fi le) 
{ 

dgbfile=file; 

dbgl ine=line; 


} 
void debug (const char *fmt,...) 
{ 
va_list argp; 
fprintf(stderr, "DEBUG: \"%s\", line %d: ", dbgfile, dbgl ine) ; 
va_start (argp, fmt) ; 
vfprintf (stderr, fmt, argp) ; 
va_end (argp) ; 
fprintf(stderr, "\n") ; 
} 
有 了 这 套 机 制 以 后 ， 这 样 的 调用 
DEBUG("i is %d", i); 
会 被 扩展 为 
dbginfo ( LINE FILE ), debug ("i is %d", i); 
从 而 输出 
DEBUG: "x.c", line 10: i is 42 
让 辅助 函数 返回 一 个 变 参 函 数 的 指针 是 个 更 妙 的 想法 : 
void debug (char *,...); 
void (*dgbinfo(int, char *)) (char *,...); 
#define DEBUG (*dbginfo( LINE ; FILE ))void (*dbginfo (int 
line, char *file )) (char *,...) 


{ 


dbgfile=file; 

dbgl ine=l ine; 

return debug; 
} 
使 用 这 样 的 定义 ，DEBUG("iis %d",i); 29 EA: 
(tdbginfo( FILE ,_ _FILE_ _ )) ("i is %d", i); 
另 一 种 可 能 更 简单 的 方式 是 : 
#define DEBUG printf ("DEBUG: \"%s\", line %d: ", \ 


FILE. _, LINE. _), printf 
iXFE, DEBUG (‘I is %d",i); 直 接 扩展 为 : 
printf ("DEBUG: \"%s\", line %d: ", 
FILE , LINE. _),printf("i is %d", i); 


[DLLC 标 准 没有 要 求 编译 器 扫描 标识 符 的 前 31 个 字符 以 后 的 字符 。 
D]. 严 格 地 讲 ， 雪 > 头 文件 甚至 都 不 必 一 定 是 文件 。 扫 > 语法 通常 都 保留 给 系统 定 
义 的 头 文件 。 


[31.C99 引 入 了 对 具有 可 变 参 数列 表 的 函数 式 宏 的 正式 支持 。 在 宏 “ 原 型 ” 的 末尾 
加 上 符号 ... 就 像 在 可 变 参数 的 函数 定义 中 ) ， 宏 定义 中 的 伪 宏 __VA_ARGS__ 
就 会 在 调用 时 蔡 换 成 可 变 参 数 。 
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19904F ANSI CHRE (X3.159-1989) (现在 被 I SO 9899:1990 及 正在 进行 的 修 
ERR) 的 发 布 使 C 语 言 作为 一 种 稳定 语言 广 为 接 受 。 标 准 澄清 了 语言 中 存在 
的 许多 模糊 之 处 ， 但 同时 也 引入 了 一 些 新 的 功能 和 定义 ， 有 时 这 也 会 带 来 问题 。 
在 澄清 模糊 问题 的 过 程 中 ， 如 果 跟 某 人 以 前 的 经 验 不 同 ， 或 者 用 ANSI 之 前 的 编译 
器 来 编译 标准 广泛 接受 以 后 写 出 的 代码 ， 都 可 能 产生 误解 。 

有 几 种 途径 可 以 查 到 标准 C。 它 原来 是 由 美国 国家 标准 协会 (ANSI) 委托 的 
一 个 委员 会 (X3J11) 起 草 的 ， 因 此 它 被 称 为 “ANSI C”。ANSI C 标 准 被 国际 标准 
化 组 织 ASO) 接受 ， 因 此 有 时 也 被 称 为 TSO C”。 而 ANSI 最 终 又 接受 了 ISO 的 版 
本 《替代 了 原来 的 版 本 ) ， 因 此 现在 经 常 也 称 “ANSVISO C”。 除 非 你 想 强 调 ISO 
修改 之 前 的 原 ANSI 标 准 ， 否 则 这 些 称谓 之 间 没 有 什么 实质 的 区 别 ， 可 以 简单 地 称 
其 为 “C 标 准 ? 或 “标准 C”。 (如 果 在 C 语 言 的 上 下 文中 讨论 ， 那 么 直接 使 用 “ 标 
准 ” 一 词 也 可 以 接受 。) 
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问 : 什么 是 “ANSI1 CRE” ? 

答 : 1983 年 ， 美 国 国家 标准 协会 (ANSI) 委任 一 个 委员 会 X3J11 对 C 语 言 进 
行 标准 化 。 经 过 长 期 艰 香 的 过 程 ， 该 委员 会 的 工作 于 1989 年 12 月 14 日 被 正式 批准 
ANANSI X3.159-1989 并 于 1990 年 春天 颁布 。ANSI C 主 要 对 现存 的 实践 进行 标准 
化 ， 同 时 增加 了 一 些 来 自 C++ 的 内 容 〈 主 要 是 函数 原型 ) 并 支持 多 语言 字符 集 
(包括 备 受 争议 的 三 字符 序列 ) 。ANSI C 标 准 同时 规定 了 C 运 行 库 例 程 的 标准 。 

年 左右 以 后 ， 该 标准 被 接受 为 国际 标准 ， 称 为 ISO/IEC 9899:1990， 这 个 标 
准 甚 至 在 美国 国内 代替 了 早先 的 X3.159 〈 新 标准 在 美国 称 作 ANSIISO 9899- 
1990[1992]) 。ISO 标 准 的 章节 编号 和 ANSI 不 太一 样 〈 简 单 地 说 ，ISO 标 准 的 5 到 7 
章 大 致 跟 原 ANSI 标 准 的 2 到 4 章 对 应 ) 。 

作为 一 个 ISO 标准 ， 它 会 以 发 行 技术 勤 误 和 标准 附录 的 形式 不 断 更 新 。 

1994 年 ， 技 术 勘 误 1 (TC1) 修正 了 标准 中 约 40 处 地 方 ， 多 数 都 是 小 的 修改 或 
说 明 ， 而 标准 附录 1 (NAL) 增加 了 大 约 50 页 的 新 材料 ， 多 数 是 规定 国际 化 支持 的 
新 库 函 数 。1995 年 ，TC2 增 加 了 更 多 的 小 修改 。 

最 近 ， 该 标准 的 一 个 重大 修订 ，C99， 已 经 完成 并 被 接受 。[2] 

该 标准 的 数 个 版 本 ， 包 括 C99 和 原始 的 ANSI 标 准 ， 都 包含 了 一 个 “基本 原 
FE” (Rationale) ， 解 释 它 的 许多 决定 并 讨论 了 很 多 细节 问题 ， 包 括 本 文中 提 及 的 
某 些 内 容 。 


11.2 


问 : 如 何 得 到 一 份 标准 的 副本 ? 
答 : 可 以 用 18 美 元 从 www.ansi.org 在 线 购 买 一 份 电子 副本 (PDF) 。 在 美国 可 
以 从 以 下 地 址 获取 印刷 版 本 : 


American National Standards Institute 

11 W.42nd St.,13th floor 

New York,NY 10036 USA 

(+1)212 642 4900 

和 

Global Engineering Documents 

15 Inverness Way E 

Englewood,CO 80112 USA 

(+1)303 397 2715 

(800)854 7179 (U.S.& Canada) 

其 他 国家 ， 可 以 联系 适当 的 国内 标准 组 织 ， 或 日 内 瓦 的 ISO 组 织 ， 地 址 是 : 

ISO Sales 

Case Postale 56 

CH-1211 Geneve 20 

Switzerland 

或 者 参见 URL  http://www.iso.ch ”或 查阅 ”comp.std.internat FAQ 列 表 的 
Standards.Faq. 

HH Herbert Schild 注 释 的 名 不 副 实 的 Annotated ANSI C Standard 包 含 ISO 9899 的 
多 数 内 容 。 这 本 书 由 Osborne/McGraw-Hill 出 版 ，ISBN 为 0-07-881952-0， 在 美国 售 
价 大 约 40 美 元 。 有 人 认为 这 本 书 的 注解 并 不 值 它 和 官方 标准 的 差价 ， 因 为 里 边 错 
漏 百出 ， 有 些 标准 本 身 的 内 容 甚 至 都 不 全 。 网 上 有 很 多 人 甚至 建议 完全 忽略 里 边 
的 注解 。 在 http:/www.lysator.liu.se/c/schildt.html 可 以 找到 Clive Feather 对 该 注解 的 
评论 (“注解 的 注解 ”)。 

“ANSI 基 本 原理 ”(ANSI Rationale) 的 最 初 文本 可 以 从 
ftp://ftp.uu.net/doc/standards/ansi/X3.159-1989 匿 名 ftp 下 载 (参见 问题 18.20)〉 ， 也 可 
以 在 万 维 网 从 http://www .lysator.liu.se/c/rat/ 

title.html 得 到 。 这 本 基本 原理 由 Silicon Press 出 版 ，ISBN 为 0-929306-07-4。 

C9X 的 公众 评论 草案 可 以 从 ISO/IEC ，JTCLSC22/WG14 的 网 站 得 到 ， 地 址 为 
http://www.dkuug.dk /JTC1/SC22/WG14/. 

参见 问题 11.3。 


11.3 


问 : 我 在 哪里 可 以 找到 标准 的 更 新 ? 
答 : 你 可 以 在 以 下 网 站 找到 相关 信息 〈 包 括 C9X 草 案 ) : 
http://www .lysator.liu.se/c/index.html、 http:/www.dkuug.dk/JTC1/SC22/WG14/ 和 


http://www.dmk.com/. 
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ANSI C 标 准 中 引入 的 最 重要 的 内 容 就 是 函数 原型 (function prototype, M 
C++ 中 借鉴 而 来 的 ) ， 它 用 于 声明 函数 的 参数 类 型 。 为 了 保持 兼容 ， 无 原型 声明 
依然 可 以 接受 ， 这 使 得 函数 原型 的 规则 有 些 复杂 。 


11.4 


问 : 为 什么 我 的 ANS1 编 译 器 在 遇 到 以 下 代码 时 都 会 警告 类 型 不 匹配 ? 

extern int func (float); int func (x) 

float x; 

{...} 

答 : 你 混用 了 新 型 的 原型 声明 “extern = int ”func(float);”* 和 老式 的 定义 “int 
func(x)float x;”。 通 常 这 两 种 风格 可 以 混用 (参见 问题 11.5) ， 但 是 这 种 情况 下 不 
行 。 

旧 的 C 编 译 器 (包括 未 使 用 原型 和 可 变 参 数列 表 的 ANSI C， 参 见 问题 15.2) 
会 "放宽 ” 传 入 函数 的 某 些 参数 。float 被 提升 为 double，char 型 和 short 型 被 提升 为 
int。 对 于 旧式 的 函数 定义 ， 如 果 在 函数 中 那样 声明 了 ， 则 参数 值 会 在 被 调 函 数 的 
内 部 自动 转换 为 对 应 的 较 鹤 的 类 型 。 因 此 问题 中 的 旧式 定义 实际 表明 func 接 受 
double 型 ， 但 在 函数 内 会 被 转 回 float 型 。 

这 个 问题 有 两 种 解决 方案 。 一 种 是 在 定义 中 使 用 新 的 语法 : 

int func (float x) { ...} 

另 一 种 是 把 新 型 原型 声明 改 成 跟 旧式 定义 一 致 : 

extern int func (double) ; 

这 种 情况 下 ， 如 果 可 能 ， 最 好 把 旧式 定义 也 改 成 使 用 double。[3] 

坚 无 疑问 ， 在 函数 参数 和 返回 值 中 避免 使 用 “ 罕 ”(char、short int 和 float) 类 
型 要 安全 得 多 。 

参见 问题 1.25。 


参考 资料 : [18, Sec. A7. 1 p. 186] 
[19, Sec. A7. 3.2 p. 202] 
[8, Sec. 6. 3.2.2, Sec. 6.5. 4. 3] 
[14, Sec. 3. 3. 2. 2, Sec. 3. 5. 4. 3] 
[11, Sec. 9.2 pp. 265-267, Sec. 9.4 pp. 272-273] 
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能 否 混 用 旧式 的 和 新 型 的 函数 语法 ? 
答 : 这 样 做 是 合法 的 ， 并 且 对 于 后 向 兼容 是 有 用 的 ， 但 还 是 小 心 为 妙 〈 特 别 
参见 问题 11.4) 。 现 代 的 做 法 是 在 声明 和 定义 的 时 候 都 用 原型 形式 。 旧 式 的 语法 
被 认为 已 经 废弃 ， 所 以 对 它 的 官方 支持 某 一 天 可 能 会 取消 。 

参考 资料 : [8,Sec.6.7.1,Sec.6.9.5] 
[11,Sec.9.2.2 pp.265-267,Sec.9.2.5 pp.269-270] 


11.6 


问 : 为 什么 下 述 声 明报 出 了 一 个 奇怪 的 警告 信息 “Struct X declared 
inside parameter list” ? 

extern int f (struct x *p); 

答 : 与 C 语 言 通常 的 作用 域 规则 大 相 径 庭 的 是 ， 在 原型 中 第 一 次 声明 〈 甚 至 
提 到 〉 的 结构 不 能 和 同一 源 文 件 中 声明 的 其 他 结构 兼容 。 问 题 在 于 结构 和 标签 在 
原型 的 结束 时 就 超出 了 作用 域 。 

参见 问题 1.30。 

要 解决 这 个 问题 ， 可 能 需要 重新 安排 ， 将 结构 的 真实 声明 放 到 使 用 它 的 函数 
原型 之 前 。 

(通常 函数 原型 和 结构 声明 会 放 到 同一 个 头 文件 中 ， 以 便 三 者 相互 引用 。) 
如 果真 的 要 在 函数 原型 中 使 用 还 没有 过 到 过 的 结构 ， 则 需要 在 同一 源 文件 的 原型 
之 前 放 上 这 样 的 声明 : 

struct x; 


它 在 文件 作用 域内 提供 了 一 个 (不 完整 的 ) 结构 x 的 声明 ， 这 样 ， 后 续 用 到 


结构 x 的 声明 至 少 能 够 确定 它们 引用 的 是 同一 个 结构 x。 
参考 资料 : [8, Sec. 6.1.2.1, Sec. 6.1.2. 6, Sec. 6.5. 2. 3] 
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1.7 


H: 有 个 问题 一 直 困 扰 着 我 ， 它 是 由 这 一 行 

printf ("%d", n) ; 

导致 的 ， 因 为 n 是 个 long int 型。 难道 ANSI 的 函数 原型 不 能 检查 这 种 函数 
的 参数 不 匹配 问题 吗 ? 

答 : 参见 问题 15.3。 


—_ 
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: 我 听 说 必须 在 调用 printf 之 前 包含 刀 stdio.h> 之 。 为 什么 ? 
答 : 参见 问题 15.1。 


| 
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从 C++ 引入 的 另 一 个 特性 是 类 型 系统 的 另 一 个 维度 : 类 型 限定 词 。 类 型 限定 
词 可 以 修改 指针 类 型 (从 而 影响 指针 或 所 指 的 对 象 》， 因 此 被 限定 的 指针 声明 有 
些 技巧 。( 本 市 的 问题 涉及 const， 但 多 数 问 题 也 适用 于 其 他 限定 词 ， 如 


volatile。 ) 


11.9 


问 : 为 什么 不 能 在 初始 化 和 数组 维度 中 使 用 const 值 ? 例如 

const int n=5; 

int aln]; 

答 : const 限 定 词 真正 的 含义 是 “只 读 ”"， 用 它 限定 的 对 象 通常 是 运行 时 不 能 被 
赋值 的 对 象 。 因 此 用 const 限 定 的 对 象 的 值 并 不 完全 是 一 个 真正 的 常量 ， 不 能 用 作 
数组 维度 、case 行 标 或 类 似 环境 。 在 这 点 上 C 和 C++ 不 一 样 。 如 果 你 需要 真正 的 编 
译 时 常量 ， 使 用 预 处 理 宏 #define (或 enum) 。 

参考 资料 : [35, Sec. 3. 4] 

[8, Sec. 6. 4] 
[11, Secs. 7.11.2, 7.11.3 pp. 226-227] 


11.10 


=]: “const char *p” . “char const *p” e “char * const p” AATE 
别 ? 

答 : 前 两 个 可 以 互 换 。 它 们 声明 了 一 个 指向 字符 常量 的 指针 《这 意味 着 不 能 
改变 它 所 指向 的 字符 的 值 ); “char * const p” 声 明 一 个 指向 (可 变 ) 字符 的 指针 
常量 ， 就 是 说 ， 你 不 能 修改 指针 。“ 从 里 到 外 ”看 就 可 以 理解 它们 。 参 见 问 题 
1.21。 


参考 资料 : [35,Sec.6.5.4.1] 
[8,Sec.6.5.4.1] 
[14,Sec.3.5.4.1] 
[11,Sec.4.4.4 p.81] 


11.11 


问 : 为 什么 不 能 向 接受 const char **A) A k4 Achar **? 

答 : 可 以 向 接受 const T 的 指针 的 地 方 传 入 T 型 的 指针 任何 类 型 T 都 适用 〉。 
但 是 ， 这 种 允许 在 被 限定 的 指针 类 型 上 轻微 不 匹配 的 规则 (明显 的 例外 〉 却 不 能 
递归 应 用 ， 只 能 用 于 最 上 层 。 (因为 const char ** 是 const char 的 指针 的 指针 ， 所 以 
这 个 例外 规则 并 不 适用 。) 

不 能 问 const char ** 指 针 赋 char ** 值 的 原因 有 些 星 深 。const 限 定 词 既 然 存在 ， 
就 是 为 了 让 编译 器 帮助 你 保证 不 修改 const 值 。 这 就 是 为 什么 可 以 将 char =MR 
const char *， 但 反 过 来 却 不 行 。 显 然 ， 使 普通 指针 “常数 化 ”是 安全 的 ， 但 反之 就 
危险 了 。 但 是 ， 假 如 进行 下 边 这 样 更 加 复杂 的 一 系列 赋值 : 


const char c='x'; /* 1 */ 
char *p1; /* 2 */ 
const char **p2=&p1; /* 3 */ 
*p2=&c; /* 4 */ 
*p1='X'; /* 5 */ 


在 第 3 行 ， 我 们 将 char ** 值 赋 给 const char **。 (编译 器 应 该 会 报警 。) 在 第 4 
行 ， 将 const char * 值 赋 给 const char * 变 量 ， 这 是 完全 合法 的 。 第 5 行 中 ， 我 们 又 修 
改 了 char * 指 癌 的 对 象 一 一 这 也 应 该 是 合法 的 。 但 是 ，p1 最 终 却 指 癌 了 c， 而 c 却 是 
const 的 。 这 发 生 在 第 4 行 ， 因 为 *p2 实 际 就 是 p1。 而 这 又 是 由 第 3 行 导 致 的 。 
此 ， 第 3 行 的 赋值 形式 是 不 允许 的 。[4] 

问 const char ** 赋 char ** 值 (如 第 3 行 和 问题 中 的 代码 〉 并 不 会 立即 导致 危 
险 。 但 它 会 营造 一 种 环境 ， 使 得 p2 的 承诺 一 一 即 最 终 所 指 的 值 不 能 修改 一 一 无 法 
遵守 。 如 果 必 须 赋值 或 传递 除了 在 最 上 层 还 有 限定 词 不 匹配 的 指针 ， 你 必须 使 用 
显 式 的 类 型 转换 (本 例 中 ， 使 用 (const char **)) ， 不 过 ， 通 常 需要 使 用 这 样 的 转 
换 意味 着 还 有 转换 所 不 能 修复 的 深层 次 问题 。 


参考 资料 : [35, Sec. 3. 1. 2. 6, Sec. 3. 3. 16. 1, Sec. 3. 5. 3] 


[8, Sec. 6. 1. 2. 6, Sec. 6. 3.16. 1, Sec. 6. 5. 3] 
[11, Sec. 7.9.1 pp. 221-222] 


11.12 


问 : 我 这 样 声明 : 
typedef char *charp; 
const charp p; 


为 什么 是 p 而 不 是 它 所 指向 的 字符 为 const? 
Pee 


Z: typedef h 4 4RIf A se EET CAIN © 
见 问题 1.13。) 在 声明 


const charp p; 


(这 正 是 typedef 的 优点 之 一 。 参 


= 


中 ，p 被 声明 为 const 的 原因 跟 const int i 将 i 声明 为 const 的 原因 一 样 。p 的 声明 不 
会 “深入 ”typdef 的 内 容 来 发 现 涉及 了 指针 。 
参考 资料 : [11, Sec 4.4.4 pp. 81-82] 


main( ) PK ži HE H 


管 根据 定义 ， 每 个 C 程 序 都 必须 提供 一 个 名 为 main 的 函数 ， 但 main 函 数 声 
慨 特别 ， 因 为 它 有 两 种 合法 的 参数 列表 ， 而 声明 的 其 余部 分 (特别 是 返回 值 


N 
很 
) 又 是 由 程序 外 的 因 系 〈( 即 真正 调用 main 的 启动 代码 〉 所 控制 。 


明 却 
类 型 
11.13 


问 : 能 否 通 过 将 main 声 明 为 void 来 关 挤 “main 没 有 返回 值 ” 的 警告 ? 

答 : 不 能 。main 必 须 声 明 为 返回 int、 接 受 0 个 或 两 个 适当 类 型 的 参数 。 换 言 
之 ， 只 有 两 种 合法 的 声明 : 

int main(void); 

int main(int agrc, char **argv) ; 

但 是 这 些 声明 的 书写 方式 却 有 好 几 种 。 第 2 个 参数 可 以 声明 为 char *argv[] (& 
见 问题 6.4) ， 可 以 使 用 任何 名 称 来 代 蔡 这 两 个 参数 ， 也 可 以 使 用 旧式 的 语法 : 

int main () 

int main (argc, argv) 

int argc; char **argv; 

最 后 ，int 返 回 值 可 以 省 略 ， 因 为 int 是 缺 省 的 返回 值 〈 参 见 问 题 1.25) 。 

如 果 调 用 了 exit 但 还 是 有 警告 ， 铠 怕 得 插入 一 条 见 余 的 return 语 句 〈 或 者 使 用 
存在 的 某 种 “未 到 达 ”(not reached) 指令 ) 

将 函数 声明 为 void 不 仅 关 掉 或 重新 排列 了 警告 信息 ， 它 可 能 还 会 导致 跟 调 用 
者 (对 main 来 说 ， 就 是 C 的 运行 时 启动 代码 ) 的 期 望 a 
就 是 说 ， 如 果 返 回 void 和 返回 int 值 的 函数 调用 序列 不 同 ， 则 局 动 代码 会 使 用 返 
int 的 调用 序列 调用 main 函 数 。 如 果 main 被 错误 地 声明 为 void， 它 可 能 
《参见 问题 2.19。 ) 

(注意 ， 这 里 的 讨论 仅 适 用 于 “宿主 ”实现 ， 对 于 “独立 ”实现 并 不 适用 。 后 者 

能 甚至 都 没有 main 函 数 。 然 而 ， 独 立 实现 相对 较 少 ， 如 果 你 使 用 的 是 独立 实 
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宿主 实现 ， 那 么 这 些 规则 就 适用 了 。 ) 
参考 资料 : [35, Sec. 2. 1. 2.2.1 Sec.F.5.1] 
[8, Sec. 5. 1. 2.2.1 Sec.G.5.1] 
[11, Sec. 20. 1 p. 416] 
[22, Sec. 3.10 pp. 50-51] 


11.14 


问 : main() 的 第 3 个 参数 envp 是 怎么 回 事 ? 

答 : 这 是 一 个 (尽管 很 常见 但 却 〉 不 标准 的 扩展 。 如 果真 的 需要 用 标准 的 
getenv() 函 数据 供 的 方法 之 外 的 办 法 访问 环境 变量 ， 可 能 使 用 全 局 变量 environ 会 更 
好 〈 尽 管 它 也 同样 并 不 标准 ) 。 

参考 资料 ，[35,Sec.F.5.1] 

[8,Sec.G.5.1] 
[11,Sec.20.1 pp.416-417] 


11.15 


问 : 我 觉得 把 main() 声明 为 void 也 不 会 失败 ， 因 为 我 调用 了 exit () 而 不 是 
return， 况 且 我 的 操作 系统 也 忽略 了 程序 的 退出 /返回 状态 。 

答 : 这 跟 main(0) 函 数 返 回 与 否 以 及 是 否 使 用 返回 状态 都 没有 关系 。 问 题 是 如 
果 main() 声 明 得 不 对 ， 它 的 调用 者 (运行 时 的 启动 代码 ) 可 能 甚至 都 不 能 正确 调 
用 它 〈 因 为 可 能 产生 调用 习惯 冲突 。 参 见 问 题 11.12〉。 

你 的 操作 系统 可 能 会 忽略 退出 状态 ， 而 void main0 在 你 那里 也 许可 行 ， 但 这 
不 可 移植 而 且 不 正确 。 


11.16 


问 : 那么 到 底 会 出 什么 问题 ? 真 的 有 什么 系统 不 支持 void main() 吗 ? 
答 : 有 人 报告 用 BC++4.5 编 译 使 用 void main0 的 程序 会 朋 溃 。 某 些 编译 器 〈 包 


f§DEC C V4.1 和 局 用 某 些 警告 的 gcc) 会 对 void main0 发 出 警告 。 
11.17 


问 : 为 什么 以 前 流行 的 那些 C 语 言 书 总 是 使 用 void main() ? 

答 ; 可 能 这 本 书 的 作者 把 自己 也 归 为 目标 读者 的 一 员 。 很 多 书 不 负责 任 地 在 
例子 中 使 用 void main0， 并 宣称 这 样 是 正确 的 。 但 他 们 错 了 。 或 者 他 们 假定 每 个 
人 都 在 恰巧 能 工作 的 系统 上 编写 代码 。 


11.18 


问 : 在 main() 中 调用 exit(status) 和 返回 同样 的 status 真 的 等 价 吗 ? 

答 : 是 ， 也 不 是 。 标 准 声 称 它 们 等 价 。 但 是 如 果 在 退出 的 时 候 需要 使 用 
main0 的 局 部 数据 ， 那 么 从 main0 中 retum 和 恐怕 就 不 行 了 。 参 见 问题 16.5。 少 数 非 
第 古老 的 、 不 符合 标准 的 系统 可 能 对 其 中 的 某 种 形式 在 使 用 时 出 现 问题 。 最 后 ， 
在 main0) 函 数 的 递归 调用 时 ， 二 者 显然 不 能 等 价 。 

参考 资料 : [19, Sec. 7.6 pp. 163-164] 

[8, Sec. 5. 1. 2. 2. 3] 


预 处 理 功 能 


ANSI ”CC 向 C 语 言 预 处 理 器 引入 了 几 项 新 的 功能 ， 包 括 “ 字 符 串 化 "和 “符号 粘 
贴 ? 操 作 符 及 加 ragma 指 令 。 


11.19 


H: 我 试图 用 ANS1“ 字 符 串 化 ” 预 处 理 操 作 符 '#' 向 信息 中 插入 符号 常量 的 
值 ， 但 它 字 符 串 化 的 总 是 宏 的 名 字 而 不 是 它 的 值 。 为 什么 ? 

答 : # 的 定义 表明 它 会 立即 字符 串 化 宏 参数 ， 而 不 会 进行 进一步 的 扩展 (如 
果 宏 参数 正好 又 是 另 一 个 宏 的 名 称 ) 。 可 以 用 下 面 这 样 的 两 步 方法 迫使 宏 既 字符 
串 化 又 扩展 : 

#define Str (x) #x 

#define Xstr (x) Str (x) 

#define OP plus 

char *opname=Xstr (OP) ; 

这 段 代 码 把 opname 置 为 "plus" 而 不 是 "OP"。 【这样 可 行 是 因为 Xstr0 宏 扩展 了 
它 的 参数 ， 然 后 str0 又 对 它 进行 了 字符 串 化 。) 

在 使 用 符号 粘贴 操作 符 夫 连接 两 个 宏 的 值 ( 而 不 是 名 字 〉 时 也 要 采用 同样 
ANE TET AR” 

FANE AHAB R EUR HE. EE ES ET, 
只 能 在 宏 定 义 中 使 用 。 

参考 资料 : [35,Sec.3.8.3.2,Sec.3.8.3.5 example] 

[8,Sec.6.8.3.2,Sec.6.8.3.5] 


11.20 


问 : 人 警告 信息 “warning: macro replacement within a string 


literal” 是 什么 意思 ? 

答 : 有 些 ANSI 前 的 编译 器 / 预 处 理 器 把 下 面 这 样 的 宏 定义 : 

#define TRACE (var, fmt) printf ("TRACE: var=fmt\n", var) 

解释 为 

TRACE (i, %d) ; 

这 样 的 调用 会 被 扩展 为 

printf ("TRACE: i=%d\n", i) ; 

换言之 ， 字 符 串 字面 量 内 部 也 作 了 宏 参 数 扩 展 。 (这 种 解释 甚至 可 能 就 是 早 
期 实现 的 一 个 意外 ， 但 对 这 样 的 宏 却 正好 有 用 。) 

K&R 和 标准 C 都 没有 定义 这 样 的 宏 扩 展 。 (这样 做 会 很 危险 而 且 令 人 困惑 ， 
参见 问题 10.22。) 当 你 希望 把 宏 参 数 转 成 字符 串 时 ， 可 以 使 用 新 的 预 处 理 操作 符 
# 和 字符 串 字 面 量 拼接 (ANSI 的 另 一 个 新 功能 

#define TRACE (var, fmt) \ 

printf ("TRACE: " #var "=" #fmt "\n", var) 
参见 问题 11.19。 
参考 资料 : [11, Sec. 3.3.8 p.51] 


11.21 


H: 为 什么 在 我 用 #ifdef 去 掉 的 代码 里 出 现 了 奇怪 的 语法 错误 ? 

答 : 在 ANSI C 中 ， 被 者 f、#fdef 或 #fndef“ 关 掉 ” 的 代码 仍然 必须 包含 “合法 的 
预 处 理 符号 ”。 这 意味 着 字符 "和 ' 必 须 像 在 真正 的 C 代 码 中 那样 严格 配对 ， 且 这 样 
的 配对 不 能 跨行 。 特 别 要 注意 缩 略 语 中 的 搬 号 看 起 来 很 像 字 符 常 量 的 开始 。 
此 ， 自 然 语 言 的 注释 和 伪 代 码 必 须 写 在 “正式 的 ?注释 分 隔 符 /* 和 ”中 。 但 是 请 参见 
问题 20.23 和 10.25。 

参考 资料 : [35, Sec. 2.1.1.2, Sec. 3.1] 

[8, Sec. 5.1.1.2, Sec. 6. 1] 
[11, Sec. 3.2 p. 40] 


问 : #pragma 是 什么 ， 有 什么 用 ? 
答 : 元 ragam 指 令 提供 了 一 种 定义 明确 的 “救生 舱 ”， 可 以 用 作 各 种 《不 可 移植 
的 ) 实现 相关 的 控制 和 扩展 : 源码 表 控 制 、 结 构 压 缩 和 警告 去 除 〈 就 像 lint 的 老 /* 
NOTREACHED */ 注 释 ) 等 。 
参考 资料 : [35, Sec. 3. 8. 6] 
[8, Sec. 6. 8. 6] 
[11, Sec. 3.7 p. 61] 


11.23 


问 : “#pragma once” 是 什么 意思 ? 我 在 一 些 头 文件 中 看 到 了 它 。 

答 : 这 是 某 些 预 处 理 器 实现 的 用 于 使 头 文件 自我 识别 的 扩展 ， 也 就 是 说 ， 妆 
头 文件 被 多 次 包含 的 时 候 ， 它 会 确保 其 内 容 只 被 处 理 一 次 。 它 跟 问 题 10.7 中 讲 到 
的 贡 fndef 技 巧 等 价 ， 不 过 移植 性 差 些 。 有 人 声称 pragma once 可 以 实现 得 更 “高 
效 ”( 当 然 ， 此 处 只 涉及 编译 时 的 效率 ) ， 但 事实 上， 如 果 预 处 理 器 真 的 那么 在 乎 
编译 的 效率 ， 它 完全 可 以 用 同样 的 方法 处 理 能 够 移植 的 失 fndef 技 巧 。 


其 他 的 ANSI C 问 题 


11.24 


问 : char a[3]="abc"; 合法 吗 ? 它 是 什么 意思 ? 

答 : 尽管 只 在 极其 有 限 的 环境 下 有 用 ， 可 它 在 ANSI C《〔 可 能 也 包括 一 些 
ANSI 之 前 的 系统 ) 中 是 合法 的 。 它 声明 了 一 个 长 度 为 3 的 数组 ， 把 它 的 3 个 字符 初 
始 化 为 a、 吓 和 'c， 但 却 没 有 通常 终止 的 \0' 字 符 。 因 此 该 数组 并 不 是 一 个 真正 的 C 
字符 串 ， 从 而 不 能 用 在 strcpy、Printf %s 等 语句 当中 。 

多 数 时 候 ， 应 该 让 编译 器 计算 数组 初始 化 的 初始 值 个 数 ， 在 初始 值 "abc" 中 ， 
计算 得 到 的 长 度 当 然 应 该 是 4。 

参考 资料 : [35, Sec. 2.5.7] 

[8, Sec. 6.5. 7] 
[11, Sec. 4.6.4 p. 98] 


11.25 


问 : 既然 对 数组 的 引用 会 退化 为 指针 ， ARA, 如 果 array 是 数组 ， array 和 以 
array 之 间 有 什么 区 别 呢 ? 
答 : 参见 问题 6.12。 


11.26 


问 : 为 什么 我 不 能 对 void * 指 针 进 行 算术 运算 ? 

答 ， 编译 器 不 知道 所 指 对 象 的 大 小 。 (请 记 住 ， 指 针 的 算术 运算 总 是 基于 所 
指 对 象 的 大 小 的 。 参 见 问题 44。) 因此 不 允许 对 void * 指 针 进 行 算术 运算 (尽管 
有 些 编译 器 作为 扩展 允许 这 种 运算 ) 。 在 作 运算 之 前 ， 可 以 把 指针 转化 为 char * 
型 或 你 准备 操作 的 其 他 指针 类 型 ， 但 是 请 参考 问题 4.5 和 16.8。 


参考 资料 : [35, Sec. 3.1.2.5, Sec. 3. 3. 6] 
[8, Sec. 6.1.2.5, Sec. 6. 3. 6] 
[11, Sec. 7.6.2 p. 204] 


11.27 


问 : memcpy () 和 memmove () 有 什么 区 别 ? 

答 : 如 果 源 和 目的 参数 有 重 厂 ，memmove0) 能 提供 有 保证 的 行为 ， 而 
memcpy() 则 不 能 提供 这 样 的 保证 ， 因 此 可 以 实现 得 更 加 有 效率 。 如 果 有 疑问 ， 最 
好 使 用 memmove()。 

实现 memmove0 好 像 很 容易 ， 只 需 一 个 额外 的 检测 即 可 对 重 登 参数 提供 有 效 
的 保证 : 

void *memmove (void *dest, void const *src, size_t n) 

{ 

register char *dp=dest; 
register char const *sp=src; 
if (dp<sp) { 
while (n-->0) { 
*dp++=*sp++; 


} 


} else { 
dpt=n; 
spt=n; 
while (n-->0) 
*-—dp=*—~sp ; 


} 
return dest; 
} 
BRAS EY ES Ah Rell. FRET LER (dp<sp) hi AEA CERT 
比较 的 两 个 指针 所 指 问 的 位 置 不 一 定 在 同一 个 对 象 中 ) ， 而 且 也 可 能 不 像 看 起 来 
那么 代价 低廉 。 在 某 些 机 器 上 ， 尤 其 是 分 段 体系 下 ， 实 现 起 来 可 能 需要 更 多 技 


巧 ， 而 且 也 会 更 低 效 。[5] 
参考 资料 : [19, Sec. B3 p. 250] 
[35, Sec. 4. 11. 2. 1, Sec. 4. 11. 2. 2] 
[8, Sec. 7.11. 2. 1, Sec. 7. 11. 2. 2] 
[14, Sec. 4. 11. 2] 
[11, Sec. 14.3 pp. 341-342] 
[12, Sec. 11 pp. 165-166] 


11.28 


问 : malloc(0) 有 什么 用 ? 返回 一 个 空 指针 还 是 指向 0 字 节 的 指针 ? 

答 : ANSUWISO 标 准 声称 它 可 能 返回 任意 一 种 ， 其 行为 由 实现 定义 (参见 问题 
11.14) 。 可 移植 的 代码 要 么 别 调用 malloc(0)， 要 么 做 好 它 可 能 返回 空 指针 的 处 
理 。 


参考 资料 : [35, Sec. 4. 10. 3] 
[8, Sec. 7. 10. 3] 
[12, Sec. 16.1 p. 386] 


11.29 


E: 为 什么 ANS1 标 准 规定 了 外 部 标识 符 的 长 度 和 大 小 写 限 制 ? 

答 : 问题 在 于 连接 器 既 不 受 ANSIISO 标 准 的 控制 也 不 遵守 C 编 译 器 开发 者 的 
规定 。 限 制 仅 限 于 标识 符 开始 的 几 个 字符 而 不 是 整个 标识 符 。 在 原来 的 ANSI 标 准 
中 限制 为 6 个 字符 ， 但 在 C99 中 放宽 到 了 31 个 字符 。 

参考 资料 : [8, Sec. 6. 1. 2, Sec. 6.9.1] 

[14, Sec. 3. 1. 2] 
[9, Sec. 6. 1. 2] 
[11, Sec. 2.5 pp. 22-23] 


11.30 


问 : noalias 是 怎么 回 事 ? 在 它 身 上 发 生 了 什么 ? 

答 : 类 型 限定 词 noalias 〈 跟 const 和 volatile 处 于 同一 个 语法 类 ) 本 意 是 用 来 断 
言 一 个 对 象 没 有 被 别 的 指针 所 指向 〈 即 没有 “别名 ”) 。 主 要 的 应 用 领域 是 让 函数 
的 实 参 对 大 数组 进行 运算 。 如 果 不 能 确保 源 数组 和 目的 数组 没有 重合 ， 编 译 器 通 
常 就 不 能 利用 (超级 计算 机 的 ) 癌 量化 和 其 他 并 行 硬件 。 

关键 字 noalias 没 有 什么 “预演 *”， 它 是 在 评估 和 批准 阶段 才 引 入 的 。 对 它 进行 
准确 定义 和 一 致 的 解释 十 分 困难 ， 从 而 引发 了 广泛 而 激烈 的 争论 。 它 的 潜在 影响 
十 分 广泛 ， 尤 其 是 对 某 些 库 函 数 ， 进 行 相 应 的 修改 并 不 容易 。 

由 于 noalias 广 受 批评 ， 而 且 准 确定 义 noalias 十 分 困难 ， 委 员 会 拒绝 接受 它 ， 
尽管 表面 上 它 看 起 来 很 有 了 吸 引力。 撰写 标准 的 时 候 ， 不 能 随 随便 便 就 引入 某 种 
特性 。 它 的 完全 整合 、 所 有 影响 都 必须 充分 考虑 。) 对 非 重 登 操作 的 并 行 实现 的 
支持 的 需求 依然 未 能 满足 ， 不 过 在 这 个 问题 上 已 经 做 了 一 些 工作 了 。 

参考 资料 : [35, Sec. 3.9. 6] 

[8, Sec. 6.9. 6] 


EEN BY AE ton HEE H hn E A 


尽管 AN C 主 要 是 对 现存 的 实践 进行 了 标准 化 ， 但 它 也 引入 了 一 些 新 的 功 
É, E 代码 在 某 些 老 的 编译 器 上 无 法 编译 。 而 且 ， 任 何 编译 器 都 可 
EE 提供 非 标准 的 扩展 或 者 接受 (并 认可 ) 标准 认为 有 疑义 的 代码 。 


全 
H 
4 
H 


11.31 


问 : 为 什么 我 的 编译 器 对 最 简单 的 测试 程序 都 报 出 了 一 大 堆 的 语法 错误 ? 对 
这 段 代 码 的 第 一 行 就 报错 了 : 

main(int argc, char **argv) 

{ 


return 0; 


— 


> 


答 : 可 能 是 个 ANSI 前 的 编译 器 ， 不 能 接受 函数 原型 或 类 似 的 东西 。 参 见 问 题 
1.32、10.9、11.32 和 16.2。 

如 果 没 有 ANSI 编 译 器 ， 你 需要 转换 某 些 新 代码 〈 像 本 书 中 出 现 的 这 些 代码 ) 
才能 编译 。 步 又 如 下 。 

(去 掉 函 数 原 型 声明 中 的 参数 类 型 信息 ， 将 原型 风格 的 函数 定义 转换 成 旧 的 
风格 。 新 式 的 声明 

extern int f1(void) ; 

extern int f2(int) ; 


int main(int argc, char **argv) {...} 
int f3(void) {...} 

extern int f1(); 

extern int f2(); 


int main (argc, argv) int argc; char **argv {...} 


int f30 {...} 

(请 注意 “ 罕 ” 类 型 的 参数 。 参 见 问题 11.4。) 

(2) 用 char * 蔡 换 void *。 

(3) 也 许 还 要 在 “通用 ”指针 刚刚 用 char * 蔡 换 的 void *) 和 其 他 指针 类 型 转换 
的 时 候 加 上 显 式 的 类 型 转换 (例如 调用 malloc、free 的 时 候 以 及 qsort 比 较 函 数 
等 ) 。 参 见 问题 7.10 和 13.9。 

(9D 回 函 数 传 入 “错误 ”的 数值 类 型 的 时 候 ， 进 行 类 型 转换 。 如 sqrt((double)i)。 

(5) 去 掉 const 和 volatile 限 定 词 。 

(6) 修 改 任何 初始 化 的 自动 聚集 (参见 问题 1.32) 。 

(7) 使 用 旧 的 库 函 数 〈 参 见 问题 13.24) o 

(8) 修 改 任何 涉及 # 和 幸 的 预 处 理 宏 。 参 见 问 题 10.20、10.21 和 11.20。 

(9) 将 二 stdarg.h> 的 工具 转 为 varars.h>〈 人 参见 问题 15.7) 。 

(10) 可 能 需要 修改 以 NULL 或 0 为 第 一 个 或 第 二 个 参数 的 realloc 调 用 。 (Bul 
问题 7.34) 。 

(11) 可 能 需要 修改 涉及 #elif 的 条 件 编译 。 

(12) 禄 祥 。【〈 换 言 之 ， 这 里 所 列 的 步骤 并 不 一 定 足 够 ， 还 可 能 需要 任何 转换 
指南 都 没有 提 及 的 其 他 复杂 变化 。) 

参见 问题 11.33。 


11.32 


问 : 为 什么 有 些 ASNIXZ1S0 标 准 库 函 数 未 定义 ? 我 明明 使 用 的 就 是 ANS1 编 译 
Fo 

答 : 你 很 可 能 有 一 个 接受 ANSI 语 法 的 编译 器 ， 但 并 没有 安装 兼容 ANSI 的 头 
文件 或 运行 库 。 事 实 上 ， 这 种 情形 在 使 用 非 三 商 提供 的 编译 器 《〈 如 gcc) 时 非常 常 
见 。 参 见 问题 11.31、12.27 和 13.26。 


11.33 


问 : 谁 有 可 以 在 旧 的 0 程序 和 ANSI| ”C0 之 间 相 互 转换 的 工具 ， 或 者 自动 生成 原 
型 的 工具 ? 


答 : 有 两 个 程序 protoize 和 unprotoize 可 以 在 有 原型 和 无 原型 的 函数 定义 和 声 
明之 间 相 互 转换 。 这 些 程序 不 能 完全 完成 < 经 典 "C 和 ANSI C 之 间 的 转换 。 这 些 程 
序 是 FSF 的 GNU C 编 译 器 发 布 的 一 部 分 。 参 见 问题 18.3。 

unproto 程 序 (ftp.win.tue.nl 上 的 pub/unix/unpoto5.shr.Z〉 是 位 于 预 处 理 器 和 下 
一 个 编译 流程 之 间 的 过 滤器 。 它 可 以 在 运行 时 将 ANSI C 转 换 为 传统 C。 

GNU GhostScript 包 提供 了 一 个 叫 ansi2knr 的 程序 。 

在 ANSI ”CC 向 旧式 代码 转化 之 前 ， 请 注意 这 样 的 转化 不 能 总 是 安全 的 和 上 自动 
的 。ANSI C 引 入 了 K&R C 没 有 提供 的 诸多 新 功能 和 复杂 性 。 你 得 特别 小 心 有 原 
型 的 函数 调用 ， 也 可 能 需要 插入 显 式 的 类 型 转换 。 参 见 问题 11.4 和 11.31。 

存在 儿 个 原型 生成 器 ， 其 中 多 数 都 是 对 lint 的 修改 。1992 年 3 月 在 
comp.sources.misc 上 发 布 了 一 个 叫做 CPROTO 的 程序 。 还 有 一 个 叫做 “cextract” 的 
程序 。 很 多 厂商 都 会 随 他 们 的 编译 器 提供 类 似 的 小 实用 程序 。 参 见 问题 18.20。 但 
在 为 “ 罕 ” 参 数 的 旧 函 数 生成 原型 时 要 小 心 。 参 见 问 题 11.4。 

最 后 ， 你 是 否 真 的 需要 将 很 多 旧 代 码 转 化 为 ANSI C 呢 ?旧式 的 函数 语法 仍然 
可 以 接受 ， 而 仓促 的 转换 则 很 容易 引入 错误 。 “参见 问题 11.4。 ) 


11.34 


问 : 为 什么 声称 兼容 ANS1 的 编译 器 不 能 编译 这 些 代码 ? 我 知道 这 些 代码 是 
ANSI 的 ， 因 为 gcc 可 以 编译 。 

答 : 许多 编译 器 都 文 持 一 些 非 标准 的 扩展 ，gcc 尤 甚 。 你 能 确认 被 拒绝 的 代码 
不 依赖 这 样 的 扩展 吗 ? 编译 器 可 能 有 个 选项 可 以 关 掉 扩展 ， 如 果 不 能 确认 你 的 代 
码 是 否 兼 容 ANSI C， 最 好 关 掉 扩展 。 (gcc 正 好 有 个 -pedantic 选 项 ， 可 以 关 掉 扩展 
并 严格 遵循 ANSI C 的 规范 。) 

通常 用 特定 的 编译 器 试验 来 确定 一 种 语言 的 特性 是 个 坏 主 意 ， 使 用 的 标准 可 
能 允许 变化 ， 而 编译 器 也 可 能 有 错 。 参 见 问题 11.38。 


很 显然 ， 设 立 标准 就 是 为 了 让 程序 和 编译 器 都 和 它 兼 容 〈 从 而 相互 兼容 ) 。 
然而 兼容 性 却 并 不 是 一 个 非 此 即 彼 的 简单 问题 。 有 几 种 程度 的 兼容 性 ， 而 标准 范 
内 的 规定 有 时 并 不 那么 详尽 如 愿 。 为 了 保证 “C 的 精神 ”， 有 些 特性 没有 明确 规 
定 ， 可 移植 的 程序 自然 需要 避免 依赖 这 些 特性 。 


11.35 


问 : AR A LARK M LH Cimplementation-defined) 、 不 确定 的 
(unspecified) 和 未 定义 的 (undefined) 行为 的 区 别 。 它 们 的 区 别 到 底 在 哪 
里 ? 

答 : 首先 ， 这 3 种 情况 都 代表 了 C 语言 标准 中 没有 明确 要 求 某 个 特定 的 构造 
或 使 用 它 的 程序 必须 完成 的 事情 的 领域 。C 语 言 定 义 中 的 这 种 松散 性 是 传统 的 ， 
也 是 经 过 深思 熟 虑 的 ， 它 允许 编译 器 作者 : (1) 选 择 某 些 构 造 可 以 按照 “硬件 完成 
的 方式 ”生成 高 效 的 代码 (参见 问题 14.4) ; ( 2) 忽略 某 些 太 难 准确 定义 、 可 能 在 良 
好 书写 的 程序 中 没有 什么 实际 用 处 〈 例 如 问题 3.1、3.2 和 3.3 中 的 代码 片段 ) 的 边 
界 构造 。 

这 3 种 “标准 中 没有 准确 定义 的 ”行为 的 定义 如 下 。 

(1) 实 现 定义 的 : 实现 必须 选择 某 种 行为 。 对 程序 不 能 编译 失败 。 使 用 这 种 
构造 的 程序 并 不 错误 。) 这 种 选择 必须 有 文档 说 明 。 标 准 对 此 可 以 提供 一 些 允 许 
的 行为 供 选择 ， 也 可 能 不 强加 任何 特定 要 求 。 

(2) 不 确定 的 : 跟 未 定义 类 似 ， 但 无 需 提供 文档 。 

(3) 未 定义 的 : 任何 事情 都 可 能 发 生 。 标 准 对 此 没有 任何 要 求 。 程 序 可 能 编译 
失败 、 运 行 错误 《〈 朋 省 或 静 悄 悄 地 生成 错误 结果 ) 或 者 季 运 地 如 程序 员 所 愿 。 

注意 ， 既 然 标准 对 编译 器 面 对 未 定义 行为 的 实例 时 的 行为 没有 任何 强制 要 
求 ， 那 么 编译 器 〈 更 重要 的 是 ， 它 生成 的 代码 ) 就 可 以 作出 任何 行为 。 特 别 是 ， 
没有 任何 保证 让 程序 只 在 未 定义 的 部 分 出 错 而 其 他 部 分 正常 运行 。 在 程序 中 忍受 


未 定义 行为 的 想法 是 极其 危险 的 。 未 定义 行为 比 你 想象 的 还 要 未 定义 。【〔 问 题 3.2 
有 个 相对 简单 的 例子 。) 
如 果 你 对 书写 可 移植 代码 有 兴趣 ， 可 以 忽略 它们 的 区 别 ， 因 为 通常 你 都 希望 
避免 依赖 3 种 行为 中 的 任何 一 种 。 
参见 问题 3.10 和 11.37。 
第 4 种 不 那么 严格 定义 的 行为 是 “特定 于 区 域 设 置 的 ”(locale-specific) 。 
参考 资料 : [35, Sec. 1. 16] 
[8, Sec. 3. 10, Sec. 3. 16, Sec. 3. 17] 
[14, Sec. 1. 6] 


11.36 


问 : 一 个 程序 “合法 (legal) ” . “ARM (valid) ”或 “符合 标准 
的 ” (conforming) 到 底 是 什么 意思 ? 

答 : 简单 地 说 ， 标 准 谈 到 了 3 种 符合 性 : 符合 标准 的 程序 、 严 格 符 合 标准 的 
程序 和 符合 标准 的 实现 。 

“符合 标准 的 程序 ”是 可 以 由 符合 标准 的 实现 接受 的 程序 。 

“严格 符合 标准 的 程序 ”是 完全 按照 标准 规定 使 用 语言 ， 不 依赖 任何 实现 定 
义 、 不 确定 或 未 定义 行为 的 程序 。“ 符 合 标准 的 实现 ?是 按 标准 声称 的 实现 的 程 
Fs 

参考 资料 : [14,Sec.1.7] 


11.37 


问 : 我 很 吃惊 ，ANS1 标 准 竟然 有 那么 多 未 定义 的 东西 。 标 准 的 唯一 任务 不 就 
是 让 这 些 东西 标准 化 吗 ? 

答 : 某 些 构造 随 编 译 器 和 硬件 的 实现 而 变化 ， 这 一 直 是 C 语 言 的 一 个 特点 。 
这 种 有 意 的 不 严格 可 以 让 编译 器 生成 效率 更 高 的 代码 ， 而 不 必 让 所 有 程序 为 了 不 
合理 的 情况 承担 额外 的 负担 。 因 此 ， 标 准 只 是 把 现存 的 实践 整理 成 文 。 

编程 语言 标准 可 以 看 作 是 语言 使 用 者 和 编译 器 实现 者 之 间 的 协议 。 协 议 的 一 
部 分 是 编译 器 实现 者 同意 提供 、 用 户 可 以 使 用 的 功能 。 而 其 他 部 分 则 包括 用 户 同 


意 遵守 和 编译 器 实现 者 认为 会 被 遵守 的 规则 。 只 要 双方 都 恪守 自己 的 保证 ， 程 序 
就 可 以 正确 运行 。 如 果 任 何 一 方 违背 它 的 诺言 ， 则 结果 肯定 失败 。 

参见 问题 11.38。 

参考 资料 : [14, Sec. 1.1] 


11.38 


问 : 有 人 说 i=i++ 的 行为 是 未 定义 的 ， 但 是 我 刚 在 一 个 兼容 ANS1 的 编译 器 上 
测试 ， 得 到 了 我 希望 的 结果 。 它 真 的 是 未 定义 的 吗 ? 

答 : 面 对 未 定义 行为 的 时 候 (包括 范围 内 的 实现 定义 行为 和 不 确定 行为 〉， 
编译 器 可 能 做 任何 实现 ， 其 中 也 包括 你 所 有 期 望 的 结果 。 但 是 依赖 这 个 实现 却 不 
明智 。 

Roger Miller 提 供 了 看 待 这 个 问题 的 男 一 个 角度 : 

“有 人 告诉 我 打 篮 球 的 时 候 不 能 抱 着 球 跑 。 我 拿 了 个 篮球 ， 抱 着 就 跑 ， 一 点 问 
题 都 没有 。 

显然 他 并 不 懂 篮 球 。” 

参见 问题 7.4、11.34、11.35 和 11.37。 


[作者 写 此 书 正 在 进行 的 修正 ， 现 在 早已 完成 。- 译 者 注 
[2]. 原 书 出 版 的 时 候 ，C9X 的 修订 尚 在 进行 中 。 本 书 中 文 版 出 版 的 时 候 ，C99 已 经 


修订 完成 。 


[31. 如 果 参 数 的 地 址 已 经 确定 ， 且 有 一 个 特定 类 型 ， 那 么 改变 一 个 参数 的 类 型 可 能 
需要 其 他 改变 。 

[41.C++ 对 const 限 定 的 指针 的 赋值 规则 更 加 复杂 ， 可 以 允许 更 多 种 类 的 赋值 而 不 会 
引起 编译 警告 ， 同 时 又 能 防止 无 意 中 修 改 const 值 的 企图 。C++ 依 然 不 允许 问 const 
char **Jiitchar ** 值 ， 但 可 以 把 char ** 值 赋 给 const char * const * 类 型 。 


[51 例 如 ， 在 分 段 体系 下 正确 实现 这 个 测试 可 能 就 需要 对 指针 进行 规范 化 。 


第 12 章 标准 输入 输出 库 


程序 如 果 不 能 接受 你 的 指令 并 返回 处 理 的 结果 就 没有 多 少 用 处 。 因 此 几乎 所 
有 的 程序 都 会 做 些 输入 输出 。C 语 言 的 输入 输出 是 通过 库 函 数 实现 的 一 这 些 函 数 
在 标准 输入 输出 《或 称 *stdio”) E [1] 中 一 这 些 库 函 数 因此 也 是 C 语 言 库 中 最 常用 
的 一 部 分 。 

基于 C 语 言 的 最 小 化 原则 ， 标 准 库 采纳 了 一 种 简单 、 直 接 的 输入 输出 模型 ， 
可 以 打开 、 读 取 、 写 入 文件 。 文 件 被 当 作 有 序 字 节 流 进行 处 理 ， 当 然 也 可 以 定 
位 。 在 有 意义 的 情况 下 ， 也 可 以 区 分 文本 和 二 进 制 文件 。 使 用 字符 串 来 代表 文件 
的 任意 名 称 或 路 径 名 ， 然 后 由 底层 的 操作 系统 来 对 它 进行 解释 。 除 了 在 路 径 名 称 
之 外 ， 没 有 目录 的 概念 ， 也 没有 什么 标准 的 方法 来 创建 目录 或 获取 目录 内 容 〈 人 参 
见 第 19 章 ) 。 程 序 隐 含 打开 3 个 标准 输入 输出 流 。 可 以 从 stdin 中 读 取 ， 通 常 这 是 一 
个 交互 键盘 ， 可 以 向 stdout 或 stderr 写 入 ， 这 两 个 通常 都 是 用 户 的 显示 屏 。 但 是 ， 
几乎 没有 什么 预定 义 的 功能 可 以 处 理 键盘 和 屏幕 的 具体 细节 (参见 第 19 章 )。 

本 章 的 很 多 问题 都 跟 printf (问题 12.7 到 12.12〉 和 scanf〈 问 题 12.13 到 12.22 ) 
有 关 。 问 题 12.23 到 12.34 涉 及 了 stdio 库 中 的 其 他 函数 。 当 需要 访问 一 个 具体 文件 
时 ， 可 以 用 fopen《〈 问 题 12.29 到 12.34) 打开 它 ， 也 可 以 把 一 个 标准 流 重 定向 到 它 
《问题 12.35 到 12.38) 。 如 果 对 文本 输入 输出 不 满意 ， 还 可 以 求助 于 “二 进 制 ? 流 
(问题 12.40 到 12.45) 。 当 然 ， 在 深入 这 些 具体 的 细节 之 前 还 有 一 些 简单 的 、 介 
绍 性 的 输入 输出 问题 。 


基本 输入 输出 


j= 
j= 


问 : 这 样 的 代码 有 什么 问题 ? 
char c; 
while((c=getchar ©) !=EOF)... 
答 : 首先 ， 保 存 getchar 的 返回 值 的 变量 必须 是 int 型 。 EOF 是 getchar 返 回 的 “ 超 
出 范围 ?的 特殊 值 ， 它 跟 getchar 可 能 返回 的 其 他 任何 字符 值 都 不 一 样 。《〈 在 时 新 的 
系统 上 ， 文 件 中 已经 不 再 保存 真正 的 文件 结束 符 了 ，EOF 只 不 过 是 一 个 没有 更 多 
字符 的 信号 而 已 。〉getchar 返 回 的 值 必须 保 存在 一 个 比 char 型 大 的 变量 中 ， 这 样 
才能 保存 所 有 的 char 值 和 EOF。 
像 前 面 的 代码 片段 那样 将 getchar 的 返回 值 赋 给 char 可 能 产生 两 种 失败 情况 。 
(1) 如 果 char 型 有 符号 而 EOF( 像 通常 那样 》 定 义 为 -1， 则 十 进 制 值 为 255 的 字 
IF (N377' 或 \Xff') 会 被 符号 扩展 ， 跟 EOF 比 较 的 时 候 会 相等 ， 从 而 过 早 地 结束 输 
Ao [B] 
(2) 如 果 char 型 无 符号 ， 则 EOF 会 被 截断 〈 扔 掉 最 高 位 ， 可 能 变 成 255 或 0xff) 
而 不 再 被 识别 为 ECOF， 从 而 导致 无 休止 的 输入 [3]. 
然而 ， 如 果 char 型 有 符号 而 输入 的 又 都 是 7 位 的 字符 ， 则 这 个 错误 可 能 持续 很 
长 时 间 而 不 被 发 现 。 (普通 char 型 是 否 有 符号 由 实现 定义 。) 
参考 资料 : [18, Sec. 1.5 p. 14] 
[19, Sec. 1. 5.1 p. 16] 
[35, Sec. 3. 1. 2. 5, Sec. 4. 9. 1, Sec. 4. 9. 7.5] 
[8, Sec. 6. 1.2.5, Sec. 7.9.1, Sec. 7.9. 7. 5] 
[11, Sec. 5.1.3 p. 116, Sec. 15.1, Sec. 15. 6] 
[22, Sec. 5.1 p. 70] 
[12, Sec. 11 p. 157] 


12.2 


问 : 我 有 个 读 取 直 到 EOF 的 简单 程序 ， 但 是 我 如 何 才能 在 键盘 上 输入 那 
个 “\EOF” 呢 ? 我 看 <stdio. h> 中 定义 的 EOF 是 -1， 是 不 是 说 我 该 输入 -1? 

答 : 考虑 一 下 就 知道 ， 你 输入 的 绝 不 能 是 -1， 因 为 -1 是 两 个 字符 ， 而 getchar 
每 次 读 入 一 个 字符 。 事 实 上 ， 在 你 的 C 程 序 中 看 到 的 EOF 值 和 你 在 键盘 上 发 出 文 
件 结 束 符 的 按键 组 合 之 间 并 没有 什么 关系 。EOF 不 过 是 向 程序 发 出 的 一 个 信号 ， 

前 明 输 入 不 再 有 任何 字符 了 ， 不 论 什 么 原因 【磁盘 文件 结束 、 用 户 结束 输入 、 网 
络 流 关闭 和 LO 错误 等 。) 根据 你 的 操作 系统 ， 你 可 能 使 用 不 同 的 按键 组 合 来 表示 
文件 结束 ， 通 常 是 Ctrl-D 或 Ctrl-Z。 操 作 系统 和 标准 输入 输出 库 安 排 你 的 程序 接收 
EOF 值 。( 然 而 请 注意 ， 这 一 路 有 好 几 个 转换 。 通 常情 况 下 ， 你 不 外 fe eae 
Ctrl-D 或 Ctrl-Z 值 ， 你 在 stdio.h 文 件 中 也 不 会 发 现 EOF 宏 定义 成 了 这 样 的 值 。 


12. 


问 : 为 什么 这 些 代码 把 最 后 一 行 复制 了 两 遍 ? 
while(!feof (infp)) { 

fgets (buf, MAXLINE, infp) ; 

fputs (buf, outfp) ; 


答 : 在 C 语 言 中 ， aE A EB 得 到 EOF。 〈 换 言 
C 的 VO 和 Pascal 的 不 一 样 。) 通常 只 需要 检查 输入 例 程 的 返回 值 : 
while (fgets (buf, MAXL INE, p !=NULL) 
fputs (buf, outfp) ; 
一 般 说 来 ， 完 全 没有 必要 使 用 feof。 oo 
EOF 或 NULL 之 后 判断 是 文件 结束 条 件 还 是 读 取 错误 。 
参考 资料 : [19, Sec. 7.6 p. 164] 
[35, Sec. 4. 9. 3, Sec. 4. 9. 7. 1, Sec. 4.9. 10. 2] 
[8, Sec. 7.9. 3, Sec. 7.9.7.1,Sec.7.9.10.2] 
[11, Sec. 15. 14 p. 382] 


j 
N 
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问 : 我 用 fgets 将 文件 的 每 行内 容 读 入 指针 数组 。 为 什么 结果 所 有 的 行 都 是 
最 后 一 行 的 内 容 呢 ? 
答 : 参见 问题 7.6。 


ps 
N 
vl 


问 : 我 的 程序 的 屏幕 提示 和 中 间 输 出 有 时 没有 在 屏幕 上 显示 ， 尤 其 是 当 我 用 
管道 通过 另 一 个 程序 输出 的 时 候 。 为 什么 ? 

答 : 在 输出 需要 显示 的 时 候 最 好 使 用 显 式 的 fflush(stdout) 调 用 。[ 和 有 几 种 机 
制 会 努力 帮助 你 在 “适当 的 时 机 ?执行 得 ush， 但 这 仅 限 于 stdout 为 交互 终端 的 时 
候 。 参 见 问 题 12.26。 

参考 资料 : [35, Sec. 4. 9. 5. 2] 

[8, Sec. 7.9.5.2] 


j 
N 
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H: 我 怎样 才能 不 等 待 回 车 键 而 一 次 输入 一 个 字符 ? 
答 : 参见 问题 19.1。 


printf 格 式 


12.7 


H: 如 何在 pr intf 的 格式 串 中 输出 一 个 '%' 字 符 ? 我 试 过 \%， 但 是 不 行 。 
答 : 只 需要 重复 百 分 号 : %%。 

用 printf 输 出 % 之 所 以 困难 是 因为 % 正 是 printf 的 转 义 字符 。 任 何 时 候 printf 遇 
到 %， 它 都 会 等 待 下 一 个 字符 ， 然 后 决定 如 何 处 理 。 而 双 字 符 序列 %% 就 被 定义 
成 了 单独 的 % 字 符 。 

要 理解 为 什么 % 不 行 ， 得 知道 反 斜 杠 \ 是 编译 器 的 转 义 字符 ， 它 控制 编译 器 在 
编译 时 对 源 代码 中 字符 的 解释 。 而 这 里 我 们 的 问题 是 printf 如 何在 运行 时 控制 它 的 
格式 串 。 在 编译 器 看 来 ，\% 可 能 没有 定义 或 者 代表 一 个 % 字 符 。 就 算 printf 会 对 \ 特 
殊 处 理 ，\ 和 % 在 printf 中 都 有 效 的 可 能 性 也 不 大 。 

参见 问题 8.8 和 19.20。 

参考 资料 : [18, Sec. 7.3 p. 147] 

[19, Sec. 7.2 p. 154] 
[35, Sec. 4.9. 6. 1] 
[8, Sec. 7.9.6.1] 


ps 
N 
co 


问 : 为 什么 这 么 写 不 对 ? 

long int n=123456; 

printf ("%d\n", n); 

答 : 任何 时 候 用 printf 输 出 long ”int 型 都 必须 在 printf 的 格式 串 中 使 用 1 (小 写 
Hell") 修饰 符 〈 例 如 9%ld) 。 因 为 printt 不 知道 传 入 的 数据 类 型 ， 必 须 通过 使 用 
正确 的 格式 说 明 符 让 它 知 道 。 


12.9 


问 : 有 人 告诉 我 不 能 在 printf 中 使 用 %1f。 为 什么 printf() 用 %f 输 出 double 
型 ， 而 scanf 却 用 %1f 呢 ? 

答 : printf 的 %f 说 明 符 的 确 既 可 以 输出 float 型 又 可 以 输出 double 型 。[5] 根 
据 “ 默 认 参 数 提升 ” 

规则 (在 printf 这 样 的 函数 的 可 变 参 数列 表 中 [6]， 不 论 作用 域内 有 没有 原型 ， 
都 适用 这 一 规则 ) float 型 会 被 提升 为 double 型 。 因 此 printfO 只 会 看 到 双 精 度数 。 参 
见 问题 15.2。 

对 于 scanf， 情 况 就 完全 不 同 了 ， 它 接受 指针 ， 这 里 没有 类 似 的 类 型 提升 。 
《通过 指针 ) 向 float 存储 和 向 double 存 储 大 不 一 样 ， 因 此 ，scanf 区 别 9%f 和 %lf。 

下 表 列 出 了 printft 和 scanf 对 于 各 种 格式 说 明 符 可 以 接受 的 参数 类 型 。 


格 式 printf scanf 
$c int char * 
$d, %i int int * 
$0, Bu, %x unsigned int unsigned int * 
( 续 ) 
格 式 printf scanf 
%Sld, tli long int long int * 
$lo, lu, S unsinged long int unsigned long int * 
thd, thi int short int * 
tho, thu, thx unsigned int unsigned short int * 
$e, tf, %g double float * 
Sle, lf, tlg n/a double * 
$s char * char * 
, LPA n/a char * 
$p void void: ** 
$n int * int * 
SS none none 


(严格 地 讲 ，%Ilf 在 printf 下 是 未 定义 的 ， 但 是 很 多 系统 可 能 会 接受 它 。 要 确 
保 可 移植 性 ， 就 要 坚持 使 用 %f。) 
参见 问题 12.15 和 15.2。 


参考 资料 : [18, Sec. 7.3 pp. 145-47, Sec. 7.4 pp. 147-150] 
[19, Sec. 7.2 pp. 153-44, Sec. 7.4 pp. 157-159] 
[35, Sec. 4.9. 6. 1, Sec. 4. 9. 6. 2] 
[8, Sec. 7.9. 6.1, Sec. 7.9. 6. 2] 
[11, Sec. 15.8 pp. 357-364, Sec. 15.11 pp. 366-378] 
[22, Sec. A. 1 pp. 121-133] 


12.10 


问 : 对 于 size_t 那 样 的 类 型 定义 ， 当 我 不 知道 它 到 底 是 long 还 是 其 他 类 型 的 
时 候 ， 我 应 该 使 用 什么 样 的 printf 格 式 呢 ? 

答 : 把 那个 值 转换 为 一 个 已 知 的 长 度 够 大 的 类 型 ， 然 后 使 用 与 之 对 应 的 printf 
格式 。 例 如 ， 输 出 某 种 类 型 的 长 度 ， 可 以 使 用 

printf ("%lu", (unsigned long) sizeof (thetype) ) ; 


12.11 


Pl: 如 何 用 printf 实 现 可 变 的 域 宽度 ? 就 是 说 ， 我 想 在 运行 时 确定 宽度 而 不 
是 使 用 %8d? 
答 : 使 用 printf("%*d",width,x)。 格 式 说 明 符 中 的 星 号 表示 ， 参 数列 表 中 的 一 
个 int 值 用 来 表示 域 的 宽度 。〔 注 意 ， 在 参数 列表 中 ， 宽 度 在 输出 的 值 之 前 。) 
参见 问题 12.17。 
参考 资料 : [18,Sec.7.3] 
[19,Sec.7.2] 
[35,Sec.4.9.6.1] 
[8,Sec.7.9.6.1] 
[11,Sec.15.11.6] 
[22,Sec.A.1] 


问 : 如 何 输出 在 千 位 上 用 过 号 隔 开 的 数字 ? 货币 格式 的 数字 呢 ? 答 : < 


locale.h> 提 供 了 一 些 函 数 可 以 完成 这 些 操 作 ， 但 是 没有 完成 这 些 任 务 的 标准 方 
法 。 


Cprintf 唯 一 一 处 对 应 自 定 义 区 域 设 置 的 地 方 就 是 改变 它 的 小 数 点 字符 。) 
这 个 小 函数 可 以 格式 化 逗号 分 隅 的 数字 ， 如 果 区 域 设 置 有 于 位 分 隔 符 ， 它 也 
会 利用 : 
#include<locale.h>char *commaprint (unsigned long n) 
{ 
static int comma='\0'; 
static char retbuf [30] ; 
char *p=&retbuf [sizeof (retbuf)-1] ; 
int i=0; 
if (comma=='\0') { 
struct Iconv *lcp=localeconv () ; 
if (lcp !=NULL) { 
if (lcp->thousands_ sep !=NULL && 
*|cp->thousands sep !='\0') 
comma=*|cp->thousands_sep; 
else 


comma=", ' 


} 
*p='\0'; 
do { 
if (i%3==0 & & i !=0) 
*——p=comma ; 
*——p='0'+n % 10; 
n /=10; 
i++; 


} while(n !=0); 


return p; 
} 
更 好 的 实现 应 该 使 用 lconv 的 grouping 域 而 不 该 直接 假设 按 3 位 分 组 。 对 于 
retbuf 更 安全 的 大 小 可 能 是 4*(sizeof(long)*CHAR_BIT+2)/3/3+1。 参 见 问题 12.23。 
参考 资料 : [35, Sec. 4. 4] 
[8,Sec.7.4] 
[11,Sec.11.6 pp.301-304] 


12.13 


问 : 为 什么 scanf("%d", i) 调 用 不 行 ? 
答 : 传 给 scanf 的 参数 必须 是 指针 : 对 于 每 个 转换 的 值 ，scanf 都 会 写 入 你 传 入 
的 指针 指向 的 位 置 (参见 问题 20.1。) 。 改 为 scanf("%d",&i) 即 可 修正 上 面 的 问 


jel o 


问 : 为 什么 

char s[30]; 

scanf ("%s", s); 

不 用 及 也 可 以 ? RA ARAE Ascanf hj EAE EAER o 

答 ， 总 是 需要 指针 ， 但 并 不 表示 一 定 需要 久 操 作 符 。 当 向 scanf 传 入 一 个 数组 
的 时 候 ， 不 需要 使 用 &， 因 为 不 论 是 否 带 && 操 作 符 ， 数 组 总 是 以 指针 形式 传 入 函 
数 的 。 参 见 问题 6.3 和 6.4 (如 果 你 使 用 了 显 式 的 &， 你 会 得 到 错误 的 指针 类 型 。 
参见 问题 6.11。) 


问 : 为 什么 这 些 代码 不 行 ? 
double d; 
scanf ("%f", &d) ; 


答 : 跟 printf 不 同 ，scanf 用 9%1f 代 表 double 型 ， 用 %f 代 表 float 型 。[Z] %6f 格 式 告 
诉 scanf; 住 备 接收 float 型 指针 ， 而 不 是 你 提供 的 double 型 指针 。 要 么 使 用 %lf， 要 人 么 
将 接收 变量 声明 为 float。 参 见 问题 12.9。 


12.16 


H: 为 什么 这 段 代码 不 行 ? 

short int s; 

scanf ("%d", &s) ; 

答 : 在 转换 %d 的 时 候 ，scanf 需 要 int 型 指针 。 要 转换 成 short int， 则 应 该 使 
用 %hd。 参见 问题 12.9 中 的 表格 。) 


12.17 


问 : 怎样 在 scanf 格 式 串 中 指定 可 变 的 宽度 ? 

答 : 不 能 。scanf 格 式 串 中 的 星 号 表示 禁止 赋值 。 可 以 使 用 ANSI 的 字符 串 化 和 
字符 串 拼 接 操作 符 ， 基 于 一 个 包含 特定 宽度 的 预 处 理 宏 构 造 一 个 常量 格式 说 明 
符 : 

#def ine WIDTH 3 

H#define Str (x) #x 

#define Xstr (x) Str (x) /* see question 11.19 */ 

scanf ("%" Xstr (WIDTH) "d", &n); 

但 是 ， 如 果 宽 度 是 运行 时 变量 ， 就 只 能 在 运行 时 创建 格式 说 明 符 了 : 

char fmt[10] ; 

sprintf (fmt, "%%%dd", width) ; 

scanf (fmt, &n) ; 

OFEREA FE scanf UN A A RE, (At F fscanfMsscanf t tai A He 
用 处 。) 
参见 问题 11.19 和 12.11。 


问 : 怎样 从 特定 格式 的 数据 文件 中 读 取 数 据 ? 怎样 读 入 10 个 float 而 不 用 使 
用 包含 10 次 %f 的 奇怪 格式 ? 如 何 将 一 行 的 任意 多 个 域 读 入 一 个 数组 中 ? 

答 : 一 般 来 说 ， 主 要 有 3 种 分 析 数 据 行 的 方法 : 

使 用 带 有 正确 格式 串 的 fscanf 和 sscanf。 虽 然 有 本 章 提 及 的 各 种 局 限 性 (参见 
问题 12.22) ， 但 scanf 族 的 函数 功能 还 是 很 强大 的 。 尽 管 空白 分 隔 的 域 总 是 最 容易 
处 理 的 ，scanf 格 式 串 也 可 以 用 来 处 理 更 紧 趴 的 、 基 于 列 的 、FORTRAN 风 格 的 数 
据 。 例 如 : 

1234ABC5. 678 

就 可 以 用 "%d%3s%f" 读 出 。 (参见 问题 12.21 的 最 后 一 个 例子 。 

用 strtok 或 等 价 的 其 他 工具 (参见 问题 13.6) 将 数据 行 分 解 为 用 空 (或 其 他 
TIERO 隔 开 的 域 ， 然 后 ， 用 atoi 或 atol 等 函数 单独 处 理 每 个 域 。《〈 一 旦 数据 行 被 
分 解 为 域 以 后 ， 处 理 这 些 域 的 代码 就 跟 传 统 的 main(0) 函 数 处 理 argv 数 组 的 形式 类 似 
了 。 参 见 问题 20.3。) 这 种 方法 尤其 适用 于 将 任意 多 个 〈 即 事先 不 知道 数量 ) 域 
的 一 行 读 入 一 个 数组 中 

这 里 有 个 简单 例子 ， 可 以 将 最 多 10 个 浮 点 数 的 〈 用 空白 分 隔 的 ) 一 行 读 入 一 
个 数组 : 

#include=stdlib.h> 

#def ine MAXARGS 10 

char *av[MAXARGS] ; 

int ac, i; 

double array [MAXARGS] ; 

char line[]="1 2.3 4.5e6 789e10"; 

ac=makear gv (| ine, av, MAXARGS) ; 

for (i=0; i<ac; i++) 

arrayLil=atof (av[i]); 
(makeargv 的 定义 参见 问题 13.6。) 

使 用 任何 就 手 的 指针 操作 和 库 函 数 进行 特别 处 理 。 
ATAARE 别 有 用 ， 因 为 它们 能 返回 一 个 表明 它们 停止 读 取 的 位 置 的 指针 。 

这 是 最 一 般 的 方法 ， 但 同时 也 是 最 困难 和 容易 出 错 的 方法 ， 
痛苦 的 部 分 就 是 那些 使 用 大 量 的 指针 技巧 分 解 字符 串 的 代码 。 


设计 数据 文件 和 输入 格式 的 时 候 ， 尽 量 避 免 那 些 神秘 的 操作 ， 最 好 采用 比较 
简单 的 方法 〈 如 1 和 2) 进行 解析 。 这 样 ， 处 理 文件 的 时 候 就 会 轻松 很 多 了 。 


scanf +] Zl 


尽管 scanf 看 起 来 好 像 不 过 是 和 printf 互 补 的 函数 ， 但 它 却 有 许多 基本 的 限制 ， 
有 的 程序 员 建 议 干脆 完全 避免 使 用 它 。 
12.19 


Pl: 我 像 这 样 用 "%dN\n" 调 用 scanf 从 键盘 读 取 数 字 : 

int n; 

scanf ("%d\n", &n) ; 

printf ("you typed %d\n", n); 

好 像 要 多 输入 一 行 才 返回 。 为 什么 ? 

答 : 可 能 令 人 吃惊 ，\n 在 scanf 格 式 串 中 不 表示 等 待 换行 符 ， 而 是 读 取 并 放弃 
连续 的 空白 字符 。 (事实 上 ，scanf 格 式 串 中 的 任何 空白 字符 都 表示 读 取 并 放弃 空 
日 字符 。 而 且 ， 诸 如 %d 这 样 的 格式 也 会 扔 掉 前 边 的 空白 ， 因 此 你 通常 根本 不 需要 
在 scanf 格 式 串 中 加 入 显 式 的 空白 。〉 因 此 ，"%d\n" 中 的 \n 会 让 scanf 读 到 非 空 白字 
符 为 止 ， 而 它 可 能 需要 读 到 下 一 行 才能 找到 这 个 非 空 白字 符 。 这 种 情况 下 ， 去 掉 
Nm 仅仅 使 用 "%d" 即 可 《但 你 的 程序 可 能 需要 跳 过 那个 没有 读 入 的 换行 符 。 参 见 问 
题 12.20。 ) 

scanf 函 数 是 设计 来 读 取 自 由 格式 的 输入 的 ， 而 在 读 取 键 盘 输入 的 时 候 ， 你 所 
得 到 的 往往 并 不 是 你 所 想 要 的 。“ 自 由 格式 ”意味 着 scanf 在 处 理 换 行 符 的 时 候 跟 其 
他 的 空白 一 样 。 格 式 "%d%d%d" 既 可 读 入 

123 

又 可 以 读 入 

1 

2 


3 
(比较 一 下 就 可 得 知 ，C、Pascal 和 LISP 的 源码 是 自由 格式 的 ， 而 BASIC 和 


FORTRAN 的 则 不 是 。) 
如 果 你 真 的 要 坚持 ，scanf 的 确 可 以 用 “scanset” 指 令 读 取 换行 符 : 
scanf ("%d%*[\n]", &n) ; 
scanset 尽 管 功 能 强大 ， 但 还 是 不 能 解决 所 有 的 scanf 问 题 。 参 见 问题 12.22。 
参考 资料 : [19, Sec. B1. 3 pp. 245-246] 
[35, Sec. 4.9. 6. 2] 
[8, Sec. 7.9. 6. 2] 
[11, Sec. 15.8 pp. 357-364] 


12.20 


问 : 我 用 scanf 和 %d 读 取 一 个 数字 ， 然 后 再 用 gets () 读 取 字 符 串 : 

int n; 

char str [80]; 

printf ("enter a number: "); 

scanf ("%d", &n); 

printf ("enter a string: "); 

gets (str); 

printf ("you typed %d and \"%s\"\n",n, str); 

但 是 编译 器 好 像 跳 过 了 gets( 调 用! 

答 : 如 果 你 同 问 题 中 的 程序 输入 两 行 : 

42 

a string 

Scanf 会 读 取 42， 但 却 不 会 读 到 紧 接 其 后 的 换行 符 。 换 行 符 会 保留 在 输入 流 
中 ， 然 后 被 gets0 读 取 ， 后 者 会 读 入 一 个 空 行 。 而 第 二 行 的 “a string” 则 根本 不 会 被 
读 取 。 

如 果 你 在 同一 行 输入 数字 和 字符 串 : 

42 a string 

则 代码 会 多 少 如 你 所 愿 地 运行 。 

作为 一 个 一 般 规 则 ， 不 能 混用 scanf 和 gets 或 任何 其 他 的 输入 例 程 的 调用 ， 
scanf 对 换行 符 的 特殊 处 理 几 乎 一定 会 带 来 问题 。 要 么 就 用 scanf 处 理 所 有 的 输入 ， 


要 么 干脆 不 用 。 
参见 问题 12.22 和 12.25。 
参考 资料 : [35, Sec. 4.9. 6. 2] 
[8, Sec. 7.9. 6. 2] 
[11, Sec. 15.8 pp. 357-364] 


12.21 


问 : 我 发 现 如 果 坚 持 检查 返回 值 以 确保 用 户 输 入 的 是 我 期 待 的 数值 ， 则 

scanf 的 使 用 会 安全 很 多 。 

int n; 

while (1) { 

printf ("enter a number: "); 

if (scanf ("%d", &n) ==1) 
break; 

printf ("try again: "); 

} 

printf ("you typed %d\n", n); 

但 有 的 时 候 好 像 会 陷入 无 限 循环 。[8] 为 什么 ? 

答 : 在 scanf 转 换 数字 的 时 候 ， 它 遇 到 的 任何 非 数 字 字 符 都 会 终止 转换 并 被 保 
留 在 输入 流 中 。 因 此 ， 除 非 采用 了 其 他 的 步 又 ， 那 么 未 预料 到 的 非 数 字 输 入 会 不 
靳 “阻塞 ”scanf， 因 为 scanf 永 远 都 不 能 越过 错误 的 非 数 字 字 符 而 处 理 后 边 的 合法 数 
字 字 符 。 如 果 用 户 在 应 对 前 文 的 代码 时 输入 类 似 x' 的 字符 ， 那 么 代码 会 永远 循环 
提示 “try again”， 但 却 不 会 给 用 户 重 试 的 机 会 。 

你 可 能 很 奇怪 为 什么 scanf 会 把 未 匹配 的 字符 留 在 输入 流 中 。 假 如 你 有 一 个 紧 
凌 的 数据 文件 ， 包 含 了 由 数字 和 字母 代码 组 成 的 不 带 空 白 的 行 : 

123C0DE 

你 可 能 希望 用 "%d9%s" 格 式 的 scanf 来 解析 这 行文 本 。 但 是 ， 如 果 %d 不 把 未 匹 
配 的 字符 保留 在 输入 流 中 ， 则 %s 会 错误 地 读 入 "ODE" 而 不 是 "CODE"。 这 是 词法 
分 析 中 的 一 个 标准 问题 : 在 扫描 任意 长 度 的 数字 常量 或 字母 数字 标识 符 的 时 候 ， 
只 有 读 到 “超越 ?位 置 ， 你 才能 知道 它 已 经 结束 。〈 这 也 正 是 ungetc 存 在 的 原 


Al. ) 
参见 问题 12.22。 
参考 资料 : [35, Sec. 4. 9. 6. 2] 
[8, Sec. 7.9. 6. 2] 
[11, Sec. 15.8 pp. 357-364] 


12.22 


H: 为 什么 大 家 都 说 不 要 使 用 scanf? 那 我 该 用 什么 来 代替 呢 ? 

答 : scanf 有 很 多 问题 ， 可 参见 问题 12.19、12.20 和 12.21。 而 且 ， 它 的 %s 格 式 
有 着 和 gets() 一 样 的 问题 〈 参 见 问题 12.25) ， 即 很 难保 证 接收 的 缓冲 区 不 溢 
出 。[9] 

更 一 般 地 讲 ，scanf 的 设计 适用 于 相对 结构 化 的 、 格 式 整齐 的 输入 。 设 计 上 ， 
它 的 名 称 就 是 来 自 “scan formatted”。 如 果 你 注意 ， 它 会 告诉 你 成 功 或 失败 ， 但 它 
只 能 提供 失败 的 大 致 位 置 ， 至 于 失败 的 原因 ， 就 无 从 得 知 了 。 对 scanf 做 错误 恢复 
几乎 是 不 可 能 的 。 

而 交互 的 用 户 输入 又 是 最 缺乏 格式 化 的 输入 。 设 计 良 好 的 用 户 界 面 应 该 允许 
用 户 输入 各 种 东西 一 不 仅仅 是 在 等 待 数字 的 时 候 输入 了 字母 或 标点 ， 还 包括 输 
入 过 短 、 过 长 、 根 本 没有 字符 输入 《〈 例 如， 直接 按 了 回 车 键 ) 、 提 前 的 EOF 或 其 
他 任何 东西 。 使 用 scanf 来 优雅 地 处 理 所 有 这 些 潜在 问题 几乎 不 可 能 。 可 以 先 用 
fgets 这 样 的 函数 读 入 整 行 ， 然 后 再 用 scanf 或 其 他 技术 进行 解释 。 (strtol、strtok 和 
atoi 等 函数 通常 有 用 。 参 见 问题 12.18 和 13.6。) 如 果真 的 要 用 scanf 的 任何 变 体 ， 
一 定 要 检查 返回 值 ， 以 确定 是 否 找到 了 期 竺 的 值 。 而 使 用 %s 格 式 的 时 候 , 一 定 要 
小 心 缓冲 区 溢出 。 

另外 要 注意 ， 对 scanf 的 种 种 诉 病 并 不 一 定 也 适用 于 fscanf 和 sscanf。scanf 该 入 
的 标准 输入 通常 都 是 交互 的 键盘 ， 因 此 所 受 约束 最 少 也 导致 问题 最 多 。 而 如 果 数 
据 文件 的 格式 已 知 ， 则 使 用 fscanf 就 可 能 很 合适 了 。 (只 要 检查 了 返回 值 ) 用 
sscanf 来 处 理 字 符 串 也 很 适宜 ， 因 为 如 果 不 能 匹配 可 以 很 容易 地 恢复 控制 、 重 启 
扫描 或 放弃 输入 。 

参考 资料 : [19, Sec. 7.4 p. 159] 


EC tt stdio pk AV 


12.23 


问 : 我 怎样 才 知 道 对 于 任意 的 sprintf 调 用 需要 多 大 的 目标 缓冲 区 ? 怎样 才 
能 避免 sprintf 目 标 缓冲 区 溢出 ? 

答 : 对 这 两 个 极 好 的 问题 〈 和 暂时 还 ) 没有 什么 好 答案 。 而 这 也 可 能 正 是 传统 
stdio 库 最 大 的 弱点 。 

当 用 于 sprintf 的 格式 串 已 知 且 相对 简单 时 ， 有 时 可 以 预测 出 缓冲 区 的 大 小 。 
如 果 格 式 串 中 包含 一 个 或 两 个 %s， 你 可 以 数 出 固定 字符 的 个 数 〈 或 用 sizeof 计 
算 ) 再 加 上 对 插入 的 字符 串 的 strlen 调 用 的 返回 值 。 对 于 整 型 ，%d 输 出 的 字符 数 
不 会 超过 

((sizeof (int) CHAR BIT+2)/ 3+1)/*+1 for '-' */ 

CHAR_BIT 在 <<limits.h> 之 中 定义 ， 但 是 这 个 计算 可 能 有 些 过 于 保守 了 。 它 计 
算 的 是 数字 以 八进制 存储 需要 的 字 节 数 ， 十 进 制 的 存储 可 以 保证 使 用 同样 或 更 少 
的 字 节 数 。 

当 格式 串 更 复杂 或 者 在 运行 前 未 知 的 时 候 ， 预 测 缓冲 区 大 小 会 变 得 跟 重 新 实 
现 sprintf 一 样 困 难 ， 而 且 会 很 容易 出 错 。 有 一 种 最 后 防线 的 技术 ， 就 是 用 fprintf 癌 
一 块 内 存 区 或 临时 文件 输出 同样 的 内 容 ， 然 后 检查 fprintf 的 返回 值 或 临时 文件 的 
大 小 ， 但 请 参见 问题 19.13， 并 提防 写 文件 错误 。 

如 果 不 能 确保 缓冲 区 足够 大 ， 就 不 能 调用 Sprintf， 以 防 缓冲 区 洪 出 后 改写 其 
他 的 内 存 区 。 如 果 格 式 串 已 知 ， 可 以 用 %.Ns 控 制 %s 扩 展 的 长 度 ， 或 者 使 用 %.*s。 
参见 问题 12.11。 

要 避免 洪 出 问题 ， 可 以 使 用 限制 长 度 的 sprintf 版 本 ， 即 snprintf。 这 样 使 用 : 

snpr intf (buf, bufsize, "You typed \"%s\"", answer) ; 

snprintf 在 几 个 stdio 库 中 已 经 提供 好 几 年 了 ， 包 括 GNU 和 4.4bsd。 在 C99 中 已 
经 被 标准 化 了 。 

还 有 一 个 好 处 是 ，C99 的 snprintf 提 供 了 预测 任意 sprintf 调 用 所 需 的 缓冲 区 大 小 


的 方法 。C99 的 Snprintf 返 回 它 可 能 放 到 缓冲 区 的 字符 数 ， 而 它 又 可 以 用 空 指针 和 
缓冲 区 大 小 0 进行 调用 。 因 此 ， 

nch=snpr intf (NULL, 0, fmtstring, /*other arguments*/) ; 

这 样 的 调用 就 可 以 预测 出 格式 串 扩展 后 所 需要 的 字符 数 。 

另 一 个 〈 非 标准 的 ) 选择 是 asprintf 函 数 ， 在 BSD 和 GNU 的 C 库 中 都 有 提供 ， 
它 调用 malloc 为 格式 串 分 配 空间 ， 并 返回 分 配 内 存 区 的 指针 。 这 样 使 用 : 

char *buf; 

asprintf (&buf, "%d=%s", 42, "forty—two") ; 

/know buf points to malloc'ed space containing formatted 
str ing*/ 
参考 资料 : [9, Sec. 7.13. 6. 6] 


12.24 


问 : sprintf 的 返回 值 是 什么 ? 是 int 还 是 char *? 

答 : 标准 声称 它 返 回 int 值 〈 写 入 的 字符 数 ， 跟 printf 和 fprintf 一 样 ) 。 曾 经 有 
段 时 间 ， 在 某 些 C 语 言 的 库 中 ，sprintf 用 char * 返 回 它 的 第 一 个 参数 ， 指 向 完成 的 
结果 《〈 即 跟 strcpy 的 返回 值 类 似 ) 。 


12.25 


Fl: 为 什么 大 家 都 说 不 要 使 用 gets? 

答 : 跟 fgets 不 同 ，gets 不 能 被 告知 输入 缓冲 区 的 大 小 ， 因 此 一 旦 输入 行 太 
长 ， 则 无 法 避免 缓冲 区 的 溢出 一 墨 菲 定律 告诉 我 们 ， 迟 早 都 会 出 现 超 长 的 输入 
行 [L01。 作 为 一 个 一 般 规 则 ， 永 远 使 用 fgets。 “你 可 能 会 认为 ， 由 于 这 样 那 样 的 
原因 ， 你 的 程序 中 不 会 出 现 超 过 最 大 限制 的 输入 行 ， 但 是 也 可 能 出 错 [11]， 况 
A, 不 管 怎么 说 ， 用 fgets 和 gets 一 样 简单 。) 

fgets 和 gets 的 另 一 个 区 别 是 fgets 保 留 \n'， 但 可 以 很 容易 地 将 它 扔 掉 。 问 题 7.1 
中 有 一 段 代 码 ， 演 示 了 如 何 用 fgets 代 替 gets。 参 见 问 题 7.1 ”中 用 fgets 代 蔡 gets 的 代 
码 片段 。 

参考 资料 : [14, Sec. 4. 9. 7. 2] 


[11, Sec. 15.7 p. 356] 
12.26 


问 : 我 觉得 我 应 该 在 一 长 串 的 printf 调 用 之 后 检查 errno， 以 确定 是 否 有 失 
败 的 调用 : 

errno=0; 

printf ("This\n") ; 

printf ("is\n"); 

printf ("a\n") ; 

printf ("test. \n") ; 

if (errno !=0) 

fprintf(stderr, "printf failed: %s\n", strerror (errno) ; 

为 什么 当 我 将 输出 重 定向 到 文件 的 时 候 会 输出 奇怪 的 “printf failed: Not 
a typewriter” 4.8? 

答 : 如 果 stdout 是 终端 ，stdio 库 的 很 多 实现 都 会 对 其 行为 进行 细微 的 调整 。 为 
了 做 出 判断 ， 这 些 实现 会 执行 某 些 当 stdout 不 为 终端 时 会 失败 的 操作 。 尽 管 输出 操 
作成 功 完成 ，errno 还 是 会 被 置 入 错误 代码 。 这 种 行为 确实 有 点 令 人 困惑 ， 但 严格 
地 讲 ， 它 并 不 错误 ， 因 为 只 有 当 函 数 报告 错误 之 后 检查 erro 的 内 容 才 有 意义 。 
《更 严格 地 讲 ， 只 有 当 库 函数 在 出 错时 设置 ermo 并 返回 错误 代码 的 时 候 ，errno 才 
有 意义 。) 

一 般 来 次， 最 好 通过 检查 函数 的 返回 值 来 检测 错误 。 要 检 碍 一 连 串 的 stdio 调 
用 之 后 的 累积 错误 ， 可 以 使 用 ferror。 参 见 问题 12.3 和 20.4。 

参考 资料 : [8, Sec.7.1.4,Sec.7.9.10.3] 

[22, Sec. 5. 4 p. 73] 
[12, Sec. 14 p. 254] 


12.27 


=]: fgetops/fsetops#eftel |/fseekz li] A 1+ AK FI? fgetops 和 fsetops 到 
底 有 什么 用 处 ? 


答 : ftell 和 fseek 用 long int 型 表示 文件 内 的 偏 移 量 〈 位 置 ) ， 因 此 ， 偏 移 量 被 
限制 在 2G(231-1) 以 内 。 而 新 的 fgetpos 和 fsetpos 函 数 使 用 了 一 个 特殊 的 类 型 定义 
fpos_t 来 表示 偏 移 量 。 适 当选 择 这 个 类 型 后 ，fgetpos 和 fsetpos 可 以 表示 任意 大 小 的 
文件 偏 移 量 。fgetpos 和 gsetpos 也 可 以 用 来 记录 多 字 节 流 式 文件 的 状态 。 参 见 问 题 
1.4。 

参考 资料 : [19, Sec. B1.6 p. 248] 

[35, Sec. 4. 9. 1, Secs. 4. 9.9. 1, 4.9.9.3] 
[8, Sec. 7.9.1, Secs. 7.9.9.1,7.9.9. 3] 
[11, Sec. 15.5 p. 252] 


12.28 


问 : 如 何 清除 用 户 的 多 余 输 入 ， 以 防止 在 下 一 个 提示 符 下 读 入 ? 用 
fflush (stdin) 可 以 吗 ? 

答 : 在 标准 C 中 ，fflushO) 仅 对 输出 流 有 效 。 因 为 它 对 “flush” 的 定义 是 用 于 完 
成 缓冲 字符 的 写 入 〔 而 不 是 扔 掉 他 们 〉 ， 放 弃 未 读 取 的 输入 并 不 是 fflush 在 输入 流 
上 的 类 比 意义 。 

没有 什么 标准 的 方法 用 来 放弃 输入 流 中 未 读 取 的 数据 。 有 些 厂 商 的 确实 现 
fflush， 计 fflush(stdin) 放 弃 未 读 取 的 字符 ， 但 可 移植 程序 不 能 依靠 这 样 的 实现 。 
《有些 版 本 的 stdio 库 实现 了 fpurge 和 fabor 调 用 ， 可 以 完成 同样 的 工作 ， 但 这 些 也 
不 是 标准 的 。) 同时 应 该 注意 ， 仅 仅 清空 标准 输入 的 缓冲 区 并 不 一 定 足 够 ， 未 读 
取 的 字符 还 可 能 在 其 他 操作 系统 级 的 缓冲 区 上 累积 。 

如 果 你 需要 清空 输入 ， 得 使 用 某 种 系统 特有 的 技术 ， 如 fflush(stdin)( 如 果 它 
WET RETO RIM TE) 或 其 他 操作 系统 相关 的 例 程 (如 问题 19.1 和 19.2〉。 不 过 
要 记 住 ， 如 果 你 扔 掉 了 用 户 输入 太 快 的 字符 ， 他 /她 可 能 会 感觉 十 分 受挫 。 

参考 资料 : [35, Sec. 7. 9. 5. 2] 

[8, Sec. 7.9.5.2] 
[11, Sec. 15. 2] 


HAARE OE 


12.29 


问 : 我 写 了 一 个 函数 用 来 打开 文件 : 

myfopen(char *filename, FILE *fp) 

{ 

fp=fopen (filename, "r") ; 

} 

可 我 这 样 调用 的 时 候 : 

FILE *infp; 

myfopen ("filename. dat", infp) ; 

infp 指 针 并 没有 正确 设置 。 为 什么 ? 

答 : C 语 言 的 函数 总 是 接收 参数 的 副本 ， 因 此 函数 永远 不 能 通过 向 参数 赋 
值 “ 返 回 ” 任 何 东西 。 

参见 问题 4.8。 

对 于 这 个 例子 ， 一 种 解决 方法 是 让 myfopen 返 回 FILE *: 

FILE *myfopen (char *fi |ename) 


{ 


FILE *fp=fopen (filename, "r") ; 
return fp; 
} 
然后 这 样 调用 : 
FILE *infp; 
infp=myfopen ("filename. dat") ; 
另外 ， 也 可 以 让 myfopen 接 受 FILE * 的 指针 【FILE 的 指针 的 指针 〉: 
myfopen(char *filename, FILE **fpp) 


{ 


FILE *fp=fopen (filename, "r") ; 
*fpp=fp; 

} 

然后 这 样 调用 : 

FILE *infp; 

myfopen ("filename. dat", & infp) ; 


12.30 


H: 连 一 个 最 简单 的 fopen 调 用 都 不 成 功 ! 这 个 调用 有 什么 问题 ? 
FILE *fp=fopen (filename, 'r'); 
答 : 问题 在 于 fopen 的 mode 参 数 必须 是 字符 串 ， 如 "r"， 而 不 是 字符 Cr) 。 参 


见 问 题 8.1。 
12.31 


问 : 为 什么 我 不 能 用 完整 路 径 名 打开 一 个 文件 ?这 个 调用 总 是 失败 : 
fopen("c:\newdir\file. dat", "r") ; 
答 : 你 可 能 需要 重复 那些 反 斜 杜 。 参 见 问 题 19.20。 


12.32 


H: 我 想 用 fopen 模 式 "r+" 打 开 一 个 文件 ， 读 出 一 个 字符 串 ， 修 改 之 后 再 写 
入 ， 从 而 就 地 更 新 一 个 文件 。 可 是 这 样 不 行 。 为 什么 ? 

答 : 确保 在 写 操作 之 前 先 调用 fseek， 回 到 你 准备 覆盖 的 字符 串 的 开始 ， 襄 且 
在 读 写 “+?” 模 式 下 的 读 和 写 操作 之 间 总 是 需要 fseek 或 flush。 同 时 , 记 住 改写 同样 数 
量 的 字符 ， 而 且 在 文本 模式 下 改写 可 能 会 在 改写 处 把 文件 长 度 截 断 ， 因 而 你 可 能 
需要 保存 行 长 度 。 参 见 问题 19.16。 

参考 资料 : [35, Sec. 4. 9.5.3] 

[8, Sec. 7.9.5. 3] 


È sy 


I = 


: 如 何在 文件 中 间 插 入 或 删除 一 行 〈 一 条 记录 ) ? 
: 参见 问题 19.16。 


12.34 


: 怎样 从 打开 的 流 中 恢复 文件 名 ? 
: 参见 问题 19.17。 


重 定 回 stdin 和 stdout 


12.35 


问 : 怎样 在 程序 里 把 stdin 或 stdout 重 定向 到 文件 ? 
Z. 使 用 freopen。 如 果 你 希望 通常 写 入 stdout 的 函数 人 0 将 输出 发 送 到 一 个 文 
而 又 不 能 改写 f 的 代码 ， 可 以 使 用 这 样 的 调用 序列 : 
freopen (fi le, "w", stdout) ; 
f0; 
但 请 参见 问题 12.36。 
参考 资料 : [35, Sec. 4. 9. 5. 4] 
[8, Sec. 7.9.5.4] 
[11, Sec. 15.2 pp. 347-348] 


aa 


`~ 


12.36 


问 : 一 旦 使 用 freopen 之 后 ， 怎 样 才 能 恢复 原来 的 stdout (Astdin) ? 

答 : 没有 什么 好 办 法 。 如 果 你 需要 恢复 回去 ， 那 么 最 好 一 开始 就 不 要 使 用 
freopen。 可 以 使 用 你 自己 的 可 以 随意 赋值 的 输出 〈 输 入 ) 流 变 量 ， 而 不 要 去 动 原 
来 的 stdout 〈 或 stdin) 。 例 如 ， 声 明 一 个 全 局 变量 

FILE *ofp; 

9K Ja FA fprintf(ofp,...) 0 printt(... JAY. 很 明显 ， 你 还 需要 检查 putchar 和 
puts 调 用 。) 然后 就 可 以 将 ofp 置 为 stdout 或 其 他 任何 东西 了 。 

你 也 许 在 想 是 否 可 以 这 样 完 全 跳 过 freopen: 

FILE *savestdout=stdout; 

stdout=fopen (file, "w") ; /*WRONG*/ 

然后 再 用 

stdout=savestdout; /*WRONG*/ 


来 恢复 stdout。 

这 样 的 代码 荡 人 不行， 因为 stdout〈 及 stdin 和 stderr) 通常 都 是 常量 ， 不 能 被 
赋值 〈 乍 看 起 来 ， 这 也 正 是 freopen 存 在 的 原因 ) 。 

有 一 种 不 可 移植 的 办 法 ， 可 以 在 调用 freopen(0) 之 前 保存 流 的 信息 ， 以 便 其 后 
恢复 原来 的 流 。 一 种 办 法 是 使 用 系统 相关 的 调用 如 dup0、dup20 等 。 另 一 种 办 法 
是 复制 或 查看 FILE 结 构 的 内 容 ， 但 是 这 种 方法 完全 没有 可 移植 性 ， 而 且 很 不 可 


HF 


某 些 系统 下 ， 你 可 以 显 式 地 打开 控制 终端 (参见 问题 12.38〉 ， 但 这 也 不 一 定 
就 是 你 所 需要 的 ， 因 为 原来 的 输入 或 输出 〈 即 在 调用 freopen 之 前 的 stdin 和 stdout) 
可 能 已 经 在 命令 行 被 重 定向 了 。 

如 果 你 想 获取 一 个 子 程序 的 执行 结果 ，freopen 可 能 无 论 如 何 都 不 行 。 可 以 参 
见 问 题 19.35。 


12.37 


问 : 如 何 判 断 标准 输入 或 输出 是 否 经 过 了 重 定向 ， 即 是 否 在 命令 行 上 使 用 
T<” 2 >" 

答 : DARA BAIT, (Em A AA He Pe AA REAT BER 
希望 你 的 程序 在 没有 输入 文件 的 时 候 从 stdin 获 取 输 入 ， 那 么 只 要 argv 没 有 提供 输 
入 文件 或 者 提供 了 占 位 符 《〈 如 "-") 而 不 是 文件 名 ， 就 可 以 从 stdin 获 取 输 入 了 。 如 
果 你 希望 在 输入 不 是 来 自 交 互 终端 的 时 候 禁 止 输出 ， 那 么 在 某 些 系统 《如 UNIX 
和 MS-DOS) 下 ， 可 以 使 用 isatty(0) 或 isatty(fileno(stdin)) 来 做 出 判断 。 


12.38 


问 : 我 想 写 个 像 "more" 那 样 的 程序 。 怎 样 才 能 在 stdin 被 重 定向 之 后 再 回 到 
交互 键盘 ? 

答 : 没有 可 移植 的 办 法 来 完成 这 个 任务 。 在 UNIX 下， 可 以 打开 特殊 文 
件 /dev/tty。 在 MS-DOS 下 ， 可 以 尝试 打开 “文件 ”"CON 或 使 用 BIOS 调 用 ， 如 getch。 
无 论 是 否 进行 了 输入 重 定向 ， 它 都 会 获取 键盘 输入 。* 


12.39 


H: 怎样 同时 向 两 个 地 方 输出 ， 如 同时 输出 到 屏幕 和 文件 ? 
答 : 直接 做 不 到 这 点 。 但 是 你 可 以 写 出 你 自己 的 printf 变 体 ， 把 所 有 的 内 容 都 
输出 两 次 。 下 边 有 个 简单 的 例子 : 
#include<stdio. h> 
#include<stdarg. h>void f2pr intf (FILE *fp1, FILE *fp2, char 
*fmt,...) 
{ 
va_list argp; 
va_start (argp, fmt); vfprintf (fp1, fmt, argp) ; va_end (argp) ; 
va_start(argp, fmt); vfprintf (fp2, fmt, argp) ; va_end(argp) ; 
} 
这 里 的 f2printf 就 跟 fprintf 一 样 ， 只 是 它 接受 两 个 文件 指针 《如 stdout 和 logfp) 
并 同时 输出 到 两 个 文件 。 


参见 问题 15.5。 


“一 进 制 ? 输 入 输出 


普通 的 流 包 含 可 打印 的 文本 ， 可 能 会 被 适当 地 转换 以 适应 底层 的 操作 系统 习 
惯 。 如 果 想 准确 无 误 地 读 写 任意 数据 ， 拒 绝 任何 转换 ， 震 要 “二 进 制 * 输 入 输出 。 


12.40 


H: 我 希望 按 字 节 在 内 存 和 文件 之 间 直 接 读 写 数字 ， 而 不 像 fprintf 和 
ae ee 我 该 怎么 办 ? 
: 你 想 完 成 的 一 般 称 为 二进制 ?输入 输出 。 首 先 ， 确 保 你 使 用 
了 "b" | eee "wb" 等 。 coerced 修饰 符 调 用 fopen。 然 后 用 上 和 sizeof 操 作 
符 获 取 准 备 传输 的 字 节 序列 的 句柄 。 通 常 ， 需 要 使 用 fread 和 fwrite 函 数 。 参 见 问题 
2.12 的 例子 。 

但 是 注意 ，fread 和 fwrite 并 不 一 定 代表 二 进 制 输入 输出 。 如 果 你 已 经 用 二 进 制 
方式 打开 了 文件 ， 就 可 以 在 其 上 使 用 任何 输入 输出 调用 了 《参见 问题 12.45 ”中 的 
PF) 。 如 果 用 文本 方式 打开 了 文件 ， 也 可 以 在 方便 的 时 候 使 用 fread 和 fwrite。 

最 后 ， 注 意 二 进 制 文件 不 太 可 移植 。 参 见 问题 20.5。 

参见 问题 12.43。 


12.41 


问 : 怎样 正确 地 读 取 二 进 制 文件 ? 有 时 看 到 0x0a 和 0x0d 容 易 混 消 ， 而 且 如 果 
数据 中 包含 0x1a 的 话 ， 我 好 像 会 提前 遇 到 EOF 。 

答 : 读 取 二 进 制 数 据 文件 的 时 候 应 该 用 "rb" 调 用 fopen， 以 确保 不 会 发 生 文本 
文件 的 解释 。 类 似 地 ， 写 二 进 制 文 件 时 使 用 "wb"。 在 类 似 UNIX 那 样 的 不 区 分 
文本 文件 和 二 进 制 文件 的 系统 中 ，"b" 可 以 省 略 ， 但 加 上 也 没有 什么 坏处 。) 

注意 文本 /二 进 制 区 别 只 是 发 生 在 文件 打开 时 ， 一 旦 文件 打开 之 后 ， 在 其 上 调 
用 何 种 MO 函数 无 关 紧 要 。 


参见 问题 12.43、12.45 和 20.5。 
参考 资料 : [35, Sec. 4.9.5. 3] 

[8, Sec.7.9.5.3] 

[11, Sec. 15. 2. 1 p. 348] 


12.42 


问 : 我 在 写 一 个 二 进 制 文件 的 “过 滤器 ”， 但 是 stdin 和 stdout 却 被 作为 文 
本 流 打 开 了 。 怎 样 才能 把 它们 的 模式 改 为 二 进 制 ? 

答 : 没有 标准 的 方法 来 完成 这 个 任务 。 类 UNIX 系 统 没 有 文本 /二 进 制 文件 的 
区 别 ， 因 此 也 就 没有 修改 模式 的 必要 。 有 些 MS-DOS 编 译 器 提供 setmode 调 用 。 其 
他 情况 下 ， 你 就 只 能 靠 自 己 了 。 


12.43 


问 : 文本 和 二 进 制 输入 输出 有 什么 区 别 ? 

答 : 文本 模式 下 ， 文 件 应 该 包含 可 打印 的 字符 行 〈 可 能 包括 tab 字 符 ) 。stdio 
库 的 例 程 〈getc、putc 和 其 他 函数 ) 完成 C 程 序 中 的 m 和 底层 操作 系统 的 行 结束 符 
之 间 的 转换 。 因 此 读 写 文本 文件 的 C 程 序 无 需 考 虑 底层 系统 换行 符 习 惯 。 当 C 程 序 
写 入 An 的 时 候 ， 底 层 库 会 号 入 正确 的 换行 字符 ， 而 stdio 库 检测 到 行 结束 的 时 候 ， 
它 也 会 向 调用 程序 返回 入 \n'。[12] 

而 二 进 制 方式 下 ， 数 据 在 程序 和 文件 之 间 读 写 的 时 候 没 有 经 过 任何 解释 。 

(在 MS-DOS 系 统 下 ， 二 进 制 方式 也 会 关 掉 对 Control-Z 作 为 文件 结束 符 的 检 
测 。) 

文本 方式 的 转换 也 会 在 读 入 的 时 候 影响 到 文件 表面 上 的 大 小 。 因 为 文本 方式 
下 读 出 和 写 入 的 字符 不 一 定 和 文件 中 的 字符 完全 相同 ， 磁 盘 文件 的 大 小 也 不 一 定 
和 可 以 读 出 的 字符 数 相等 。 而 且 ， 基 于 类 似 的 原因 ，fseek 和 ftell 处 理 的 也 不 一 定 
是 从 文件 开始 的 纯 的 字 节 数 。 

(严格 地 讲 ， 在 文本 方式 下 ，fseek 和 ftell 使 用 的 偏 移 值 根本 就 不 能 解释 。ftell 
的 返回 值 只 能 再 用 作 fseekd 的 参数 ， 而 fseekd 的 参数 也 只 能 使 用 ftell 的 返回 值 。) 
二 进 制 方式 下 ，fseek 和 ftell 的 确 使 用 纯 的 字 节 偏 移 。 但 是 ， 某 些 系 统 可 能 会 


在 二 进 制 文件 的 尾部 添加 一 些 空 字 节 ， 用 以 补 全 一 条 记录 。 
参见 问题 12.40 和 19.13。 
参考 资料 : [35, Sec. 4.9. 2] 
[8, Sec. 7.9. 2] 
[14, Sec. 4.9. 2] 
[11, Sec. 15 p. 344, Sec. 15.2.1 p. 348] 


12.44 


: 如 何在 数据 文件 中 读 写 结构 ? 
: 参见 问题 2.12。 


È 可 


12.45 


问 : 怎样 编写 符合 旧 的 二 进 制 数据 格式 的 代码 ? 

答 : 由 于 机 器 字 大 小 和 字 节 顺序 差别 、 浮 点 数 格式 以 及 结构 填充 等 问题 ， 要 
这 么 做 很 困难 。 要 控制 这 些 细节 ， 你 可 能 得 一 次 一 字 节 地 读 写 ， 边 看 边 调整 。 
(这 并 不 一 定 像 听 上 去 那么 坏 ， 至 少 它 让 你 写 出 可 移植 的 代码 ， 同 时 又 能 全 盘 掌 
控 。) 

例如 ， 假 设 你 要 从 流 印 读 入 一 个 数据 结构 〈 包 含 一 个 字符 、 一 个 32 位 整数 和 
一 个 16 位 整数 ) 到 C 结 构 ， 


struct mystruct { 


char c; 
long int i32; 
int 116; 
E 
可 以 使 用 这 样 的 代码 : 
s. c=getc (fp) ; 
s. i32=(long) getc (fp) < <24; 
s. i32 |=(long) getc (fp) <<16; 
s. i32 |=(unsigned) (getc (fp) <<8) ; 


s. i32 |=getc (fp) ; 
s. i16=getc (fp) <<8; 
s. i16 |=getc (fp) ; 

这 段 代 码 假设 getc 读 取 8 位 字符 而 且 数 据 以 高 字 节 在 前 “〈“ 大 端 ”>) 方式 存储 。 
转换 成 Long) 可 以 确保 16 位 和 24 位 移 位 作用 竹 long 型 信 卡 (参见 问题 3.16) ， 转 换 
成 (unsigned) 可 以 防止 符号 扩展 。〔 一 般 而 言 ， 写 这 类 代码 的 时 候 都 使 用 unsigned 
类 型 会 更 安全 。 但 请 参见 3.21。 

编写 这 个 结构 的 对 应 代码 如 下 : 

putc (s. c, fp) ;putc ((unsigned) ((s. i32>>24) & Oxff), fp); 
pute ((unsigned) ( (s. i32>>16) & Oxff), fp); 

putc ( (unsigned) ((s. i32>>8) & Oxff), fp); 

putc ((unsigned) (s. i32 & Oxff), fp) ; 

putec ((s. i16>>8) & Oxff, fp); 

putc (s. i16 & Oxff, fp); 

参见 问题 2.13、12.41 和 20.5。 


世 ]. 当 我 们 谈 到 “stdio" 库 的 时 候 ， 我 们 的 实际 意思 是 “标准 C 运 行 库 中 的 stdio 函 
数 ” 或 者 说 “二 stdio.h 二 描述 的 函数 ”。 


mo eee 某 些 系统 上 char 型 可 能 更 大 ， 但 类 似 的 失败 情况 不 可 和 避 


[3]. 跟 前 一 段 一 样 ， 值 255 假 设 char 为 8 位 。 某 些 系统 上 char 型 更 大 ， 但 类 似 的 失败 
情况 不 可 避免 。 


[和 1. 男 一 种 方法 是 用 setbuf 和 setvbuf 关 掉 输 出 流 的 缓冲 。 但 缓冲 是 个 好 东西 ， 完 全 
关 掉 它 可 能 引发 极度 的 低 效率 。 


[5]. 此 处 的 描述 同样 适用 于 %e 和 %g 以 及 对 应 的 scanf 格 式 %le 和 %lg。 

[Gl. 实 际 上 ， 默 认 参 数 提升 仅 适用 于 可 变 参 数列 表 的 可 变 部 分 。 参 见 第 15 章 。 
[71. 关 于 %e、%g 及 对 应 的 格式 %le 和 %lg 也 有 这 样 的 区 别 。 

[8]. 如 果 不 能 用 Control-C 退 出 或 者 准备 重启 ， 干 万 不 要 尝试 运行 问题 中 的 代码 。 
[9]. 指 明 域 宽度 ， 如 %20s， 可 能 会 有 帮助 。 参 见 问题 12.17。 


[0]. 在 讨论 gets 的 缺点 的 时 候 ， 人 们 会 习惯 性 地 指出 1988 年 的 “因特网 蠕虫 是 利用 
了 UNIX finger 程 序 的 gets 调 用 作为 攻击 手段 之 一 的 。 它 用 仔细 设计 的 二 进 制 数据 
使 gets 洲 出 ， 从 而 改写 了 栈 上 的 一 个 返回 地 址 ， 导 致 控制 流转 向 了 二 进 制 数据 。 


[1 你 可 能 会 认为 你 的 操作 系统 会 限制 最 大 的 键盘 输入 行 长 度 ， 可 如 果 输 入 是 从 
文件 重 定 癌 的 呢 ? 


[L2]. 有 些 系统 可 能 会 以 空格 填充 的 记录 的 方式 保存 文本 文件 。 在 这 些 系统 上 ， 尾 
部 空格 在 以 文本 方式 读 取 的 时 候 会 被 丢弃 ， 因 此 显 式 写 入 的 任何 尾部 空格 也 会 在 
再 读 入 的 时 候 丢失 。 
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从 前 ， 特 定 的 运行 库 并 不 是 C 语 言 的 正式 部 分 。ANSIISO C 出 现 以 后 ， 很 多 
传统 的 运行 库 〈 包 括 第 12 章 中 的 stdio 库 函数 ) 都 成 了 标准 。 

有 些 特别 重要 的 库 函 数 有 专门 的 音节: 第 7 章 讲 述 了 内 存 分 配 的 函数 
(malloc. frees) ， 第 12 章 讲述 了 二 stdio.h 二 描述 的 “标准 输入 输出 ”函数 。 本 章 
的 组 织 如 下 : 


字符 串 函 数 13.1~13.7 
排序 13.8~13.11 
日 期 和 时 间 13.12~13.14 
随机 数 13.15~13.21 


其 他 库 函 数 13.22~13.28 
最 后 几 个 问题 (13.25~13.28) 涉及 连接 时 出 现 的 问题 〈 如 “未 定义 的 外 部 函 
数 ， 错误 等 ) 


H: 怎样 把 数字 转 为 字符 串 〈 与 atoi 相 反 ) ? Aitoa? 

答 : 用 sprintf 就 可 以 了 : 

sprintf (string, "%d", number) ; 

(不 需 担 心 用 sprintf 会 小 题 大 作 ， 也 不 必 担 心 会 浪费 运行 时 间或 代码 空间 ， 
实践 中 它 工作 得 挺 好 。) 参见 问题 7.7 答 案 中 的 实例 以 及 问题 8.6 和 12.23。 

同 理 ， 也 可 以 用 sprintf 把 long 型 或 浮 点 数 转换 成 字符 串 〈 使 用 %1d 或 %f) 。 也 
就 是 说 ， 可 以 把 sprintf 看 成 是 atol 和 atof 的 反 函 数 。 同 时 ， 你 也 有 一 定 的 格式 控 
制 。 因 为 这 些 原因 ，C 提 供 sprintf 作 为 通用 解决 方法 ， 而 不 是 itoa。 

如 果 必 须 编写 itoa 函 数 ， 有 以 下 几 点 需要 注意 。 

(DK&R 提 供 了 一 个 示例 实现 。 

(2) 你 需要 考虑 返回 缓冲 区 的 分 配 。 人 参见 问 题 7.7。 

(3) 简 单 实现 往往 不 能 正确 处 理 最 小 负 整 数 (INT_MIN， 通 常 为 -32 768 或 -2 
147 483 648) 。 

参见 问题 12.23 和 20.11。 

参考 资料 : [18, Sec. 3.6 p. 60] 

[19, Sec. 3. 6 p. 64] 


13.2 


问 : 为 什么 strncpy 不 能 总 在 目标 串 放 上 终止 符 '\0' ? 

答 : strncpy 最 初 被 设计 为 用 来 处 理 一 种 现在 已 经 废弃 的 数据 结构 -一定 长 、 不 
必 以 \0' 结 束 的 “字符 串 ”， 四 其 他 环境 中 使 用 strncpy 有 些 有 麻烦 ， 因 为 必须 经 常 在 目 
的 串 末尾 手工 加 \0'。 

可 以 用 stmcat 代 替 stmcpy 来 绕 开 这 个 问题 。 如 果 目 的 串 开 始 时 为 空 〈 就 是 


说 ， 如 果 先 用 *dest=\0') ，strncat 就 可 以 完成 你 希望 strncpy 完 成 的 事情 。 
*dest='\0'; 
strncat (dest, source, n) ; 
这 段 代 码 最 多 复制 n 个 字符 ， 而 且 总 是 添加 \0。 
田 外 一 个 方法 十 用 
sprintf (dest, "%. *s", n, source) 
但 是 严格 来 讲 ， 这 个 方法 只 能 担保 在 n 和 =509 的 时 候 工作 正常 。 
如 果 需 要 复制 任意 字 节 【而 不 是 字符 串 〉 ，memcpy 是 个 比 strncpy 更 好 的 选 


择 。 
13.3 
hl: 0 语言 有 类 似 于 其 他 语言 中 的 “substr” (MTB) 的 例 程 吗 ? 
答 : 没有 。 其 中 一 个 原因 在 问题 7.2 和 第 8 章 中 提 到 ，C 没 有 可 控 的 字符 串 类 
型 。 


要 从 字符 串 的 POS 位 置 取 长 度 为 LEN 的 子囊， 可 以 用 : 

char dest[LEN+1] ; 

strncpy (dest, &source [POS], LEN) ; 

dest [LEN]='\0'; /* ensure \O termination */ 

或 者 使 用 问题 13.2 中 的 技巧 : 

char dest[LEN+1]=""; 

strncat (dest, &source[POS], LEN) ; 

或 者 使 用 指针 代 蔡 数组 标记 。 

strncat (dest, source+P0S, LEN) ; 

表达 式 source+POS 和 &source[POS] 在 定义 上 是 一 样 的 。 参 见 第 6 章 


13.4 


H: 怎样 把 一 个 字符 串 中 所 有 字符 转换 成 大 写 或 小 写 ? 答 : 某 些 函数 库 有 例 
程 strupr 和 strlwr 或 strupper 和 strlower， 但 是 它们 不 是 标准 的 ， 也 不 可 移植 。 
使 用 二 ctype. hh 二 > 中 提供 的 宏 toupper 和 tolower 可 以 很 直接 地 实现 大 小 写 转换 。 
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符 串 。 参 见 问题 7. 7. 

还 要 注意 ， 使 用 多 语言 字符 集 时 ， 大 小 写 的 转换 是 非常 复杂 的 。 

参考 资料 : [18, Sec. 2.7 p. 40] 
[19, Sec. 2.7 p. 43] 


pe 


3.9 


问 : 为 什么 有 些 版 本 的 toupper 对 大 写字 符 会 有 奇怪 的 反应 ? 为 什么 有 的 代 
码 在 调用 toupper 前 先 调用 islower? 
答 : 在 早期 ，toupper 是 个 类 似 函 数 的 宏 ， 而 且 它 的 定义 只 对 小 写字 母 有 效 。 
当 遇 到 数字 、 标 点 符号 或 是 大 写字 母 时 ， 它 就 会 行为 失常 。 同 样 tolower 只 对 大 号 
字母 有 效 。 所 以 ， 老 的 代码 〈 或 者 为 了 增加 可 移植 性 而 写 的 代码 ) 习惯 上 在 调用 
toupper 之 前 调用 tolower， 或 调用 tolower 之 前 先 调用 toupper。 
在 标准 C 中 规定 toupper 和 tolower 必 须 对 所 有 的 字符 正常 处 理 ， 也 就 是 说 ， 不 
需 转换 的 字符 保留 不 变 。 
参考 资料 : [35, Sec. 4. 3. 2] 
[8, Sec. 7. 3. 2] 
[11, Sec. 12.9 pp. 320-321] 
[12, p. 182] 


13.6 


问 : 怎样 将 字符 串 分 割 成 用 空白 分 隔 的 字段 ?怎样 实现 类 似 main 处 理 argc 和 
argv 的 过 程 ? 

答 : 标准 中 唯一 用 于 这 种 分 割 的 函数 是 strtok， 虽 然 用 起 来 需要 些 技巧 [21， 而 
且 不 一 定 能 做 到 你 要 求 的 所 有 事 。 《例如 ， 它 不 能 处 理 引 用 。) 这 里 有 个 简单 的 
例子 ， 它 打印 出 提取 出 来 的 每 一 个 字段 : 

#include<stdio. h> 

#include<string. h> 


char string[]="this is a test"; /* not char *; see Q 16.7 


*/ 


char *p; 

for (p=strtok (string, " \t\n"); p !=NULL; p=strtok (NULL, " \t\n")) 
printf ("\"%s\"\n", p); 

作为 另 一 个 选择 ， 这 是 我 用 来 一 次 性 构建 argv 的 例 程 : 

#include<ctype. h> 


int makeargv (char *string, char *argv[], int argvsize) 
{ 
char *p=string; 
int 1; 
int argc=0; 
for (i=0; i<argvsize; i++) { 
/* skip leading whitespaces */ 
whi le (isspace (*p) ) 
ptt; 
if (*p !='\0') 
argv [argc++]=p; 
else { 
argv [argc]=0; 
break; 
} 
/* scan over arg */ 
while(*p !='\O' & & !isspace (*p) ) 
ptt; 
/* terminate arg: */ 
if (*p !='\0' && i<argvsize-1) 
*p++='\0'; 
} 


return argc; 


makeargv 的 调用 很 简单 : 
char *av[10]; 
int i,ac=makeargv (string, av, 10) ; 
for (i=0; i<ac; i++) 
printf ("\"%s\"\n", avLil) ; 
如 果 你 希望 每 个 分 隔 符 都 起 作用 ， 例 如 想 在 一 行内 用 两 个 制 表 符 来 表示 要 忽 
略 的 字段 ， 使 用 strchr 更 直观 些 : 
#include<stdio. h> 
#include<string. h> 
char string[]="this\thas\t\tmissing\tfield"; 
char *p=string; 
while (1) { /* break in middle */ 
char *p2=strchr (p, '\t'); 
if (p2 !=NULL) 
*p2='\0' ; 
printf ("\"%s\"\n", p); 
if (p2==NULL) 
break; 
p=p2+1 ; 
} 
这 里 用 的 代码 都 会 修改 输入 字符 串 ， 用 \0 蔡 代 分 隔 符 来 终止 每 个 字段 ， 这 意 
味 着 字符 串 必 须 可 写 ， 参 见 问题 1.34。 如 果 你 需要 用 到 原来 的 字符 串 ， 分 割 前 先 
复制 一 份 。 
参考 资料 : [19, Sec. B3 p. 250] 
[35, Sec. 4. 11.5.8] 
[8, Sec. 7. 11. 5. 8] 
[11, Sec. 13.7 pp. 333-334] 
[12, p. 178] 


13.7 


问 : 哪里 可 以 找到 处 理 正则 表达 式 或 通配符 匹配 的 代码 ? 

答 : 首先 ， 确 认 你 知道 以 下 区 别 。 

传统 正则 表达 式 ， 其 变 体 常用 在 UNIX 实 用 程序 〈 如 ed 或 grep) 中 。 在 正则 表 
达 式 中 ， 一 个 点 〈.) 通常 和 单个 字符 匹配 ， 而 序列 .* 通 常 可 以 匹配 任意 字符 串 。 
(当然 ， 完 全 的 正则 表达 式 有 比 这 两 个 例子 更 多 的 特征 。) 

文件 名 通配符 ， 大 多 数 操作 系统 都 使 用 某 些 变 体 。 有 相当 多 的 变 体 ， 但 通常 ? 
匹配 单个 字符 ，*# 匹 配 任意 字符 串 。 

有 一 些 匹 配 正则 表达 式 的 包 可 以 利用 。 很 多 包 都 是 用 成 对 的 函数 ， 一 个 “ 编 
译 ? 正 则 表达 式 ， 另 一 个 “执行 ” 它 ， 即 用 它 比较 字符 串 。 碍 碍 系统 中 是 否 有 头 文 件 
<regex.h > aK <regexp.h> #ll fi Megcmp/regex. regcomp/regexecB\ 
re_comp/re_exec。 这 些 函 数 可 能 在 一 个 regexp 库 中 。 在 
ftp://ftp.cs.toronto.edu/pub/regexp.shar.Z 或 其 他 地 方 可 以 找到 Henry ”Spencer 开发 的 
广 受 欢迎 的 regexp 包 ， 这 个 包 也 可 自由 再 发 布 。GNU 工 程 有 一 个 叫做 rx 的 包 。[3] 
参见 问题 18.20。 

文件 名 通配符 匹配 〈 有 时 称 之 为 “globbing”) 在 不 同 的 系统 上 有 不 同 的 实现 。 
在 UNIX 上 ，shell 会 在 进程 调用 之 前 自动 扩展 通配符 ， 因 此 ， 程 序 几 乎 从 不 需要 专 
门 考虑 它们 。 在 MS-DOS 下 的 编译 器 中 ， 通 常 都 可 以 在 建立 argv 的 时 候 连 接 一 个 
用 来 扩展 通配符 的 特殊 目标 文件 。 有 些 系统 〈 包 括 MS-DOS 和 VMS) 会 提供 通 配 
符 指定 文件 的 列表 和 打开 的 系统 服务 。 可 参阅 编译 器 和 函数 库 的 文档。 参见 问题 
19.25 和 20.3。 

这 儿 有 个 由 ArjanKenter 编 写 的 小 巧 、 快 速 的 通配符 匹配 例 程 : 

int match(char *pat, char *str) 


{ 


switch (*pat) { 


case '\0': return !*str; 

case '*'. return match(pat+1, str) | | *str & & 
match (pat, str+1) ; 

case '?': return *str & & match (pat+1, str+1) ; 


default: return *pat==*str & & match (patt1, str+1) ; 


} 
用 这 个 定义 ， 调 用 match("a*b.c","aplomb.c") 会 返回 1。 
参考 资料 : [30, Sec. 3 pp. 35-71] 


排序 


13.8 


问 : 我 想 用 strcmp 作 为 比较 函数 ， 调 用 qsort 对 一 个 字符 串 数 组 排序 ， 但 是 
不 行 。 为 什么 ? 

答 : 你 说 的 “字符 串 数 组 ?实际 上 是 “字符 指针 数组 ”。qsort 比 较 函 数 的 参数 是 
被 排序 对 象 的 指针 ， 在 这 里 ， 也 就 是 字符 型 指针 的 指针 。 然 而 strcmp 只 接受 字符 
指针 。 因 此 ， 不 能 直接 使 用 strcmp。 要 用 下 边 这 样 的 间接 比较 函数 : 


/* compare strings via pointers */ 


int pstrcmp (const void *p1, const void *p2) 
{ 
return strcmp (*(char * const *)p1,*(char * const *)p2) ; 

} 

比较 函数 的 参数 表示 为 “通用 指针 ”const void *。 它 们 被 转换 回 本 来 表示 的 类 
型 (char **) ， 再 解 引 用 ， 生 成 可 以 传 入 strcmp 的 char *。 在 ANSI 前 的 编译 器 
中 ， 需 要 将 指针 参数 声明 为 char * 而 不 是 void *， 并 且 去 掉 前 边 的 const 限 定 词 。 

qsort 可 以 用 以 下 形式 调用 : 

#include=stdlib.h> 

char *strings[NSTRINGS]; 

int nstrings; 

/* nstrings cells of strings[] are to be sorted */ 

qsort (strings, nstr ings, sizeof (char *), pstrcmp) ; 

(不 要 被 文献 [19] 5.11 节 119 一 120 页 的 讨论 所 误导 ， 那 里 讨论 的 不 是 标准 库 

中 的 qsort， 而 且 隐 含 了 char * 和 void * 等 价 的 假设 。) 

问题 13.9 中 有 关于 qsort 比 较 函 数 更 多 的 信息 ， 例 如 它们 是 如 何 调用 以 及 必须 
如 何 定 义 等 。 

参考 资料 : [35, Sec. 4. 10.5. 2] 


[8, Sec. 7. 10. 5. 2] 
[11, Sec. 20.5 p. 419] 


13.9 


问 : 我 想 用 qsort () 对 一 个 结构 数组 排序 。 我 的 比较 函数 接受 结构 指针 ， 但 
是 编译 器 认为 这 个 函数 不 是 qsort 需 要 的 类 型 。 我 要 怎样 转换 这 个 函数 指针 才能 
避免 这 样 的 警告 ? 

答 : 正如 上 文 问 题 13.8 中 所 讨论 的 ， 这 个 转换 必须 在 比较 函数 中 进行 ， 而 函 
数 必须 定义 为 接受 “通用 指针 ”(const void *) 类 型 。 假 定 一 个 日 期 的 数据 结构 : 

struct mystruct { 
int year, month, day; 

E 

比较 函数 可 能 像 这 个 样子 [4]: 

int mystructcmp (const void *p1, const void *p2) 

{ 

const struct mystruct *sp1=p1; 

const struct mystruct *sp2=p2; 

if (sp1->year<sp2->year) return -1; 

else if (sp1—->year >sp2->year) return 1; 
else if (sp1->month<sp2->month) return -1; 
else if (sp1—>month>sp2->month) return 1; 
else if (sp1->day<sp2->day) return -1; 
else if (sp1->day>sp2->day) return 1; 

else return 0; 

} 

《从 通用 指针 到 mystruct 结 构 的 指针 的 转换 过 程 发 生 在 sp1=p1 和 sp2=p2 的 初始 
化 中 ; 由 于 pl 和 p2 都 是 void 指 针 ， 编 译 器 隐 式 地 进行 了 类 型 转换 。 在 ANSI 前 的 编 
译 器 下 必须 进行 显 式 的 类 型 转换 并 使 用 char * 指 针 。 参 见 问题 7.10) 

对 于 这 个 版 本 的 mystructcmp，qsort 的 调用 是 这 样 的 : 

#include<stdl ib. h> 


struct mystruct dates[NDATES] ; 
int ndates; 
/* ndates cells of dates[] are to be sorted */ 


qsort (dates, ndates, sizeof (struct mystruct) ,mystructcmp) ; 


另 一 方面 ， 如 果 你 对 结构 的 指针 进行 排序 ， 则 如 问题 13.8 所 示 ， 需 要 使 用 间 


接 。 比 较 函 数 的 开始 会 是 这 个 样子 : 
int myptrstructcmp (const void *p1, const void *p2) 
{ 
struct mystruct *sp1=* (struct mystruct * const *)p1; 
struct mystruct *sp2=* (struct mystruct * const *)p2; 
函数 调用 会 是 这 样 : 
struct mystruct *dateptrs[NDATES] ; 


qsort (dateptrs, ndates, sizeof (struct mystruct *),myptrstructcmp) ; 


要 理解 为 什么 qsort 的 比较 函数 中 必须 进行 奇怪 的 指针 转换 ， 以 及 为 什么 在 调 
用 qsort 时 再 进行 函数 指针 转换 并 不 起 作用 ， 很 有 必要 理解 gsort 的 工作 原理 : qsort 


并 不 知道 ， 它 只 是 在 一 段 段 内 存 块 中 进行 移动 。qsort 从 它 的 第 3 个 参数 中 得 到 内 


存 块 的 大 小 ， 这 也 是 它 唯一 知道 的 。 为 了 确定 两 个 内 存 块 是 否 需要 进行 交换 ， 
dqsort 要 调用 比较 函数 。 它 使 用 等 价 于 memcpy 的 函数 进行 交换 。 
因为 qsort 用 了 通用 的 方式 来 处 理 未 知 类 型 的 内 存 块 ， 所 以 它 用 通用 指针 


(void *) 来 引用 它们 。 当 qsort 调 用 比较 函数 时 ， 它 把 将 要 比较 的 两 块 内 存 以 两 
个 通用 指针 的 形式 传 入 你 的 函数 。 因 为 它 使 用 通用 指针 ， 比 较 函 数 必须 接受 通用 
# 针 ， 然 后 在 使 用 前 〈 例 如 ， 进 行 比较 前 ) ， 将 其 转换 回 它 们 本 来 的 类 型 。 一 个 
void 指针 和 结构 指针 是 不 一 样 的 ， 在 某 些 机 器 上 还 可 能 有 不 同 的 大 小 或 表示 ， 这 


也 是 必须 进行 类 型 转换 的 原因 。 
假设 要 对 一 个 结构 数组 进行 排序 ， 而 你 有 一 个 接受 结构 指针 的 比较 函数 : 
int mywrongstructcmp (struct mystruct *, struct mystruct *); 
如 果 这 样 调 用 gsort: 
qsort (dates, ndates, sizeof (struct mystruct), 
(int (*) (const void *,const void *))mywrongstructcmp); 
WRONG */ 


/* 


类 型 转换 (int(*)(const void *,const void 交 ) 除 了 让 编译 器 安静 、 不 再 告诉 你 这 
个 比较 函数 不 能 用 于 gsort 之 外 ， 没 有 别 的 任何 作用 。 当 gqsort 到 了 调用 你 的 比较 函 
数 时 候 ， 当 初 调用 gsort 时 作 的 类 型 转换 关系 已 经 被 遗忘 ， 它 还 是 用 const void * 来 
作为 调用 参数 ， 这 也 是 你 的 函数 必须 接受 的 。 没 有 一 个 原型 的 机 制 可 以 做 到 在 
qsort 内 调用 mywrongstructmcp 之 前 进行 从 void 指 针 到 struct mystruct 指 针 的 转换 。 
一 般 而 言 ， 为 了 让 编译 器 “ 闭 嘴 ”而 进行 类 型 转换 是 一 个 坏 主 意 。 编 译 器 的 警 
告 信 息 通 常 希望 告诉 你 某 些 事情 ， 忽 略 或 轻易 去 掉 会 让 你 陷入 危险 ， 除 非 你 明确 
知道 自己 在 做 什么 。 参 见 问题 4.9。 
参考 资料 : [35, Sec. 4. 10. 5. 2] 
[8, Sec. 7. 10. 5. 2] 
[11, Sec. 20.5 p. 419] 


13.10 


问 : 怎样 对 一 个 链表 排序 ? 
答 : 有 时 候 ， 在 建立 链表 时 就 一 直 保持 链表 的 顺序 要 简单 些 〈 或 者 用 树 代 
B) 。 插 入 排序 和 归并 排序 算法 用 链表 最 合适 了 。 
如 果 你 希望 用 标准 库 函 数 ， 可 以 分 配 一 个 临时 的 指针 数组 ， 填 入 链表 中 所 有 
节点 的 地 址 ， 再 调用 gqsort()， 最 后 依据 排序 后 的 数组 重新 建立 链表 。 
参考 资料 : [21, Sec. 5. 2.1 pp. 80-102, Sec. 5.2.4 pp. 159-168] 
[31, Sec. 8 pp. 98-100, Sec. 12 pp. 163-175] 


13.11 


问 : 怎样 对 大 于 内 存 容 量 的 数据 排序 ? 

答 : 你 可 以 用 “外 部 排序 ”法 ， 文 献 [21] 第 3 卷 中 有 详细 论述 。 基 本 的 思想 是 对 
数据 分 块 进行 排序 ， 每 次 的 大 小 尽 可 能 多 地 填 入 内 存 中 ， 把 排 好 序 的 数据 块 存 入 
暂时 文件 中 ， 再 归并 它们 。 如 果 你 的 操作 系统 提供 一 个 通用 排序 工具 ， 可 以 从 程 
序 中 调用 : 参见 问题 19.32 和 19.35， 以 及 19.33 中 的 例子 。 

参考 资料 : [21, Sec. 5. 4 pp. 247-378] 

[31, Sec. 13 pp. 177-187] 


日 期 和 时 间 


13.12 


问 : 怎样 在 C 程 序 中 取得 当前 日 期 或 时 间 ? 

答 : 只 要 使 用 函数 time、ctime、localtime 和 /或 strftime 就 可 以 了 [5]。 下 面 是 个 
简单 的 例子 : 

#include<stdio. h> 

#include<time. h> 


int main() 
{ 
time_t now; 
time (&now) ; 
printf ("It's %s", ctime (&now)) ; 
return 0; 
} 
localtime 和 strftime 的 调用 如 下 : 
struct tm *tmp=local time (&now) ; 
char fmtbuf [30] ; 
printf ("It's %d:%02d:%02d\n", 
tmp->tm_hour, tmp->tm_min, tmp->tm_sec) ; 
strftime (fmtbuf, sizeof fmtbuf, "%A, %B %d, %Y", tmp) ; 
printf ("on %s\n", fmtbuf) ; 
注意 这 些 函 数 接受 一 个 time_t 的 指针 变量 ， 虽 然 它 们 并 不 改变 它 的 值 [6]。 
如 果 需 要 小 于 秒 的 解析 度 ， 参 见 问题 19.42。 
参考 资料 : [19, Sec. B10 pp. 255-257] 
[35, Sec. 4. 12] 
[8, Sec. 7. 12] 


[11, Sec. 18] 


13.13 


问 : Feit FH localtime" jetime tt 转换 成 结构 struct tm, mctime 
可 以 把 time_t 转 换 成 为 可 打印 的 字符 串 。 怎 样 才 能 进行 反 向 操作 ， 把 struct tm 
或 一 个 字符 串 转 换 成 time 七 ? 

Z: ANSI C 提 供 了 库 函 数 mktime， 它 把 struct tm 转换 成 time_t。 

把 一 个 字符 串 转 换 成 tme_t 比 较 难 ， 这 是 由 于 可 能 遇 到 各 种 各 样 的 日 期 和 时 
间 格 式 。 

某 些 系 统 提 供 函 数 strptime， 基 本 上 是 strftime 的 反 函 数 。 其 他 常用 的 函数 有 
partime (与 RCS 包 一 起 被 广泛 地 发 布 ) 和 getdate (还 有 少数 其 他 函数 ， 发 布 在 C 
语言 新 闻 组 ) 。 参 见 问 题 18.20。 

参考 资料 : [19, Sec. B10 p. 256] 

[35, Sec. 4. 12. 2. 3] 
[8, Sec. 7. 12. 2. 3] 
[11, Sec. 18. 4 pp. 401-402] 


13.14 


问 : 怎样 在 日 期 上 加 n 天 ? 怎样 取得 两 个 日 期 的 时 间 间 隔 ? 

答 : ANSLUISO 标 准 C 函 数 mktime 和 difftime 对 这 两 个 问题 提供 了 一 些 有 限 的 支 
持 。mktime 接 受 没有 规范 化 的 日 期 ， 所 以 可 以 用 一 个 日 期 的 struct tm 结构 ， 直 接 
在 tm_mday 域 进行 加 或 减 ， 然 后 调用 mktime 对 年 、 月 、 日 域 进行 规范 化 ， 同 时 也 
转换 成 了 time _t 值 。 可 以 用 mktime 来 计算 两 个 日 期 的 time_t 值 ， 然 后 用 difftime 计 算 
两 个 time_t 值 的 秒 数 差 。 

但 是 ， 这 些 方 法 只 有 当日 期 在 time_t 表 达 范 围 内 才 保 证 工作 正常 。tm_mday 域 
是 个 int 型 ， 所 以 日 偏 移 量 超出 32 736 就 会 上 洲 〈 后 面 会 提供 男 一 个 不 含 限 制 的 方 
案 ) 。 还 要 注意 ， 在 夏令 时 转换 的 时 候 ， 一 天 并 不 是 24 小 时 ， 所 以 用 86 400 秒 /天 
时 要 特别 注意 。 

这 里 是 一 段 计算 1994 年 10 月 24 日 后 90 天 的 日 期 的 代码 片段 : 


#include<stdio. h> 
#include<time. h> 
tm1. tm_mon=10 - 1; 
tm1. tm_mday=24; 
tm1. tm_year=1994 - 1900; 
tm1. tm_hour=tm1. tm_min=tm1. tm_sec=0; 
tm1. tm_isdst=-1; 
tm1. tm_mday+=90; 
if (mkt ime (& tm1) ==-1) 
fprintf(stderr, "mktime failed\n") ; 
else 
printf ("%d/%d/%d\n", 
tm1. tm_mon+1, tm1. tm mday, tm1. tm_year+1900) ; 
设置 tm_isdst 为 -1 有 助 于 防止 夏令 时 引起 的 转换 问题 。 设 置 tn_housr 为 12 也 起 
同样 作用 。 
下 面 是 一 段 计算 从 2000 年 2 月 28 日 到 3 月 1 日 的 日 差 值 的 程序 : 
struct tm tm1, tm2; 
time_t t1, t2; 


tm1. tm mon=2 — 1; 

tm1. tm_mday=28 ; 

tm1. tm_year=2000 - 1900; 

tm1. tm_hour=tm1. tm_min=tm1. tm_sec=0; 
tm1. tm_isdst=-1; 

tm2. tm_mon=3 — 1; 

tm2. tm mday=1; 

tm2. tm_year=2000 - 1900; 

tm2. tm_hour=tm2. tm min=tm2. tm_sec=0; 
tm2. tm_isdst=-1; 

t1=mkt ime (&tm1) ; 

t2=mkt ime (&tm2) ; 


if (t1==-1 || t2==-1) 
fprintf(stderr, "mktime failed\n") ; 
else { 
long d=(difftime (t2, t1)+86400L/2) / 86400L; 
printf ("%ld\n", d) ; 
} 
另外 加 上 的 86400L/2 将 日 差 舍 入 到 最 近 的 天 数 ， 参 见 问题 14.6。 
另 一 个 解决 的 方法 是 用 “ 侍 略 日 数 (Julian day numbers) ”， 这 可 以 支持 更 宽 
的 时 间 范 围 。 颂 略 日 数 表示 从 公元 前 4013 年 1 月 1 日 起 的 天 数 [7]。ToJul 和 FromJul 
的 例 程 原型 如 下 : 
/* returns Julian for month, day, year */ 
long ToJul (int month, int day, int year); 
/* returns month, day, year for jul */ 
void FromJul (long jul, int *monthp, int *dayp, int *yearp) ; 
计算 一 个 日 期 np 天 后 的 日 期 : 
int n=90; 


int month, day, year; 

FromJul (ToJul (10, 24, 1994) +n, &month, &day, &year) ; 

两 个 日 期 间 的 天 数 : 

ToyJul (3, 1, 2000) — ToJul (2, 28, 2000) ; 

处 理 儒 略 日 的 代码 可 以 在 以 下 地 方 找到 : Snippets 收 集 (参见 问题 18.18) ~ 
SimtelMOakland 站 点 〈 文 件 JULCAL10.ZIP， 参 见 问 题 18.20) 和 文献 中 提 到 的 文 
章 “Dateconversions”[4]。 

参见 问题 13.13，20.37 和 20.38。 

参考 资料 : [19, Sec. B10 p. 256] 

[35, Secs. 4. 12. 2. 2, 4. 12. 2. 3] 
[8, Secs. 7. 12. 2. 2, 7. 12. 2. 3] 
[11, Secs. 18. 4, 18.5 pp. 401-402] 
[4] 


H: 怎么 生成 一 个 随机 数 ? 

答 : 标准 C 库 有 一 个 随机 数 生 成 器 : rand。 你 系统 上 的 实现 可 能 并 不 完美 ， 但 
写 一 个 更 好 的 实现 并 不 是 一 件 容 易 的 事 。 

如 果 你 需要 实现 自己 的 随机 数 生 成 器 ， 有 许多 这 方面 的 文章 可 供 参 考 : 像 下 
面 的 文献 或 sci.math.num-analysis 上 的 FAQ。 网 上 也 有 许多 这 方面 的 软件 包 : 老 
的 、 可 靠 的 包 有 r250、RANLIB 和 FSULTRA (参见 问题 18.20) ， 还 有 由 
Marsaglia、Matumoto 和 Nishimura 新 近 的 成 果 “Mersenne ”Twister”"”， 男 外 就 是 Don 
Knuth 个 人 网 页 上 收集 的 代码 。 

这 是 Park 和 Mlller 提 供 的 “最 小 标准 ”的 可 移植 随机 数 生成 器 的 C 语 言 实现 : 

#define a 16807 

#define m 2147483647 

#define q (m / a) 

#define r (m % a) 

static long int seed=1;long int PMrand () 


{ 


long int hi=seed / q; 
long int lo=seed % q; 
long int test=a * lo- r * hi; 
if (test >0) 
seed=test; 
else 
seed=testtm; 


return seed; 


(这 个 “最 小 标准 ”已 经 足够 好 了 。 这 是 一 个 “其 他 的 都 得 根据 它 进行 检查 ”的 
实现 , “除非 有 更 好 的 随机 数 生成 器 ”， 否 则 都 推荐 使 用 这 个 实现 。) 
这 段 代码 实现 了 a=16807、m=2147483647 〈 即 231-1) 和 c=0 的 随机 数 生成 
fe: 
X - (aX+c)mod m 
《因为 模 是 素数 ， 所 以 这 个 生成 器 没有 问题 13.18 中 描述 的 问题 。) 乘法 的 计 
算 使 用 了 Schrage 描 述 的 一 种 技术 ， 可 以 确保 中 间 结 果 aX 不 会 溢出 。 上 边 的 实现 返 
回 范围 [1,2147483647] 内 的 long int 型 ， 也 就 是 说 ， 它 跟 RAND_MAX 为 2147483647 
的 C 语 言 rand 函 数 可 以 对 应 ， 只 是 它 不 能 返回 0。 要 让 它 〈 像 Park 和 Miller 的 论文 中 
那样 ) 返回 (0,1) 范 围 内 的 浮 点 数 ， 只 需 将 声明 改 为 
double PMrand () 
再 将 最 后 一 行 改 为 
return (double) seed / m; 
Park 和 Miller 推 荐 使 用 a=48271， 这 样 可 以 得 到 稍 好 一 点 的 统计 效果 。 
参考 资料 : [19, Sec. 2.7 p. 46, Sec. 7.8.7 p. 168] 
[35, Sec. 4. 10. 2. 1] 
[8, Sec. 7. 10. 2. 1] 
[11, Sec. 17. 7 p. 393] 
[12, Sec. 11 p.172] 
[21, Vol. 2 Chap. 3 pp. 1-177] 
[26] 


13.16 


问 : 怎样 获得 某 一 范围 内 的 随机 整数 ? 
答 : 直接 用 这 种 方法 : 
rand ()% N /* POOR */ 
《试图 返回 从 0 到 N-1 的 整数 ) 不 好 ， 因 为 许多 随机 数 生 成 器 的 低位 并 不 随机 
(参见 问题 13.18) 。 一 个 较 好 的 方法 是 : 
(int) ((double) rand()/ ((double) RAND MAX+1)* N) 


如 果 你 不 希望 使 用 浮 点 数 ， 另 一 个 方法 是 : 

rand()/ (RAND_MAX / N+1) 

两 种 方法 都 需要 知道 RAND_MAX (ANSIZE <stdlib.h> PÆ X) ， 而 且 假设 
N 要 远 远 小 于 RAND_MAX。 

如 果 N 值 接近 RAND_MAX 而 随机 数 生 成 器 的 范围 又 不 是 N 的 整 倍数 《〈 即 
(RAND_MAX+1)% N !=0) ， 则 这 些 方法 都 会 失效 ， 某 些 输出 会 比 其 他 的 频率 更 
高 。〔 使 用 浮 点 数 也 没有 帮助 。 问 题 在 于 rand 返 回 RAND_MAX+1 个 互 不 相同 的 
值 ， 这 些 值 不 一 定 总 能 被 均 分 为 N 块 。)〉 如 果 出 现 这 种 问题 ， 大 概 唯一 能 做 的 就 
是 多 次 调用 rand 函 数 ， 然 后 丢弃 某 些 值 : 

unsigned int x=(RAND_MAX+1u)/ N; 

unsigned int y=x * N; 

unsigned int r; 

do { 

r=rand () ; 

} while(r>=y) ; 

return r / x; 

在 这 些 技术 中 ， 在 需要 的 时 候 改 变 生成 随机 数 的 范围 都 很 简单 ， 用 下 边 的 方 
式 可 以 生成 [M,N] 范 围 的 随机 整数 : 

M+rand()/ (RAND MAX / (N - M+1)+1) 

(顺便 提 一 下 ，RAND_MAX 是 个 常数 ， 它 告诉 你 C 语 言 库 函数 rand 的 固定 范 
围 。 不 能 将 RAND_MAX 设 为 其 他 值 ， 也 不 能 要 求 rand 返 回 其 他 范围 的 值 。) 

如 果 你 用 的 随机 数 生 成 器 返回 的 是 0 到 1 的 浮 点 数 〈 如 问题 13.15 提 及 的 
PMrand 函 数 的 最 后 一 个 版 本 或 问题 13.21 的 drand48 函 数 ) ， 要 取得 范围 在 0 到 N-1 
的 整数 ， 只 要 将 随机 数 乘 以 N 就 可 以 了 : 

(int) (drand48 () * N) 

参考 资料 : [19, Sec. 7.8.7 p. 168] 

[12, Sec. 11 p.172] 


13.17 


问 : 每 次 执行 程序 ，rand 都 返回 相同 的 数字 序列 。 为 什么 ? 


答 : 这 是 多 数 伪 随 机 数 生 成 器 的 一 个 特征 《也 是 C 语 言 库 函数 rand 的 定义 特 
征 ) ， 它 们 生成 的 随机 数 总 是 从 同一 个 数字 开始 ， 然 后 是 同一 个 序列 。《 除 了 别 
的 考量 ， 增 加 一 点 可 预测 性 会 让 调试 变 得 容易 。) 如 果 不 需 要 这 种 可 预测 性 ， 可 
以 调用 srand 用 真正 随机 的 值 来 初始 化 模拟 随机 数 生成 器 的 种 和子。 常见 的 种 子 值 可 
以 是 当前 时 间或 者 用 户 按键 之 前 过 去 的 时 间 (当然 很 难 可 移植 地 判断 按键 时 间 。 
参见 问题 19.42) 。 这 里 有 个 使 用 当前 时 间 的 例子 : 

#include<stdl ib. h> 

#include<time. h> 

srand((unsigned int) time((time_t *)NULL)) ; 

但 是 ， 这 个 代码 并 不 完美 一 一 其 中 ，time() 返 回 的 time_t 可 能 是 浮 点 值 ， 转 换 
到 无 符号 整数 时 有 可 能 上 洲 ， 这 造成 不 可 移植 。 参 见 问题 19.42。 

还 要 注意 到 ， 在 一 个 程序 执行 中 多 次 调用 srand 并 不 见得 有 帮助 ， 特 别 是 不 要 
为 了 试图 取得 “ 真 随机 数 ” 而 在 每 次 调用 rand 前 都 调用 srand。 

参考 资料 : [19, Sec. 7. 8. 7 p. 168] 

[35, Sec. 4. 10. 2. 2] 
[8, Sec. 7. 10. 2. 2] 
[11, Sec. 17.7 p. 393] 


13.18 


问 : 我 需要 随机 的 真 / 假 值 ， 所 以 我 就 直接 用 rand ()%2， 可 是 我 得 到 交替 的 
0, 1, 0, 1, 0…。 为 什么 ? 

答 : 低劣 的 伪 随 机 数 生成 器 在 低位 中 并 不 很 随机 。 很 不 幸 ， 某 些 系 统 就 提供 
这 样 的 伪 随 机 数 生 成 器 。“【 实 际 上 ， 周 期 为 2* 的 纯 线 性 同 余 随机 数 生 成 器 的 低 n 位 
会 以 2 为 周期 重复 。 而 很 多 e 位 机 的 随机 数 就 是 这 样 写 出 来 的 。) 因 此， 最 好 使 用 
高 位 。 参 见 问题 13.16。 

参考 资料 : [21, Sec. 3.2.1.1 pp. 12-14] 


13.19 


问 : 如 何 获取 根本 不 重复 的 随机 数 ? 


答 : 你 找 的 是 所 谓 的 “随机 排列 ”(random permutation) 或 “ 打 乱 次 
Fr” (shuffle) 。 一 种 方法 是 用 需要 打 乱 次 序 的 值 初 始 化 一 个 数组 ， 然 后 随机 地 将 
每 个 元 素 和 后 边 的 某 个 值 交 换 : 

int a[10], i, nvalues=10; 

for (i=0; i<nvalues; i++) 

ali]=i+1; 
for (i=0; i<nvalues-1; i++) { 
int c=randrange (nvalues—i) ; 
int t=a[i]; a[i]=a[i+c]; alitc]=t; /* swap */ 
} 
此 处 的 randrange(N) 是 randO/(RAND_MAX/(N)+1) 或 问题 13.16 中 的 某 个 其 他 表 


达 式 。 
参考 资料 : [21, Sec. 3. 4. 2 pp. 137-138] 


13.20 


H: 怎样 产生 正 态 分 布 或 高 斯 分 布 的 随机 数 ? 

答 : 至 少 有 3 种 方法 。 

运用 中 心 极限 定理 (大 数 定律 ) 将 几 个 平均 分 布 的 随机 数 加 起 来 : 
#include<stdl ib. h> 

#include<math. h> 

#def ine NSUM 25 double gaussrand () 


{ 


double x=0; 
int 1; 
for (i=0; i<NSUM; i++) 
x+= (double) rand () / RAND MAX; 
x —=NSUM / 2.0; 
x /=sqrt (NSUM / 12.0); 


return x; 


(不 要 忽略 sgrt(NSUM/12.) 的 修正 。 尤 其 是 NSUM 等 于 12 的 时 候 很 容易 忽 
o ) 
使 用 由 Box 和 Muller 提 供 的 ， 在 Knuth 的 网 上 讨论 过 的 方法 : 
#include<stdl ib. h> 
#include<math. h> 
#define PI 3. 141592654 
double gaussrand () 
{ 
static double U,V; 
static int phase=0; 
double Z; 
if (pbhase==0) { 
U=(rand()+1.)/ (RAND_MAX+2. ) ; 
V=rand()/ (RAND MAX+1. ) ; 
Z=sqrt(-2 * log(U))* sin(2 * PI * V); 
} else 
Z=sqrt(-2 * log(U))* cos(2 * PI * V); 
phase=1 - phase; 
return Z; 
} 
使 用 最 初 由 Marsaglia 提 供 的 方法 : 
#include=stdlib.h> 
#include<math. h> 
double gaussrand () 
{ 
static double V1, V2, 5S; 
static int phase=0; 
double X; 
if (pbhase==0) { 
do { 


double U1=(double) rand() / RAND MAX; 
double U2= (double) rand() / RAND MAX; 
V1=2 * U1 - 1; 
V2=2 * U2 - 1; 
S=V1 * V1+V2 * V2; 
} while(S>=1 || S==0); 
X=V1 * sqrt(-2 * log(S)/ $); 
} else 
X=V2 * sqrt(-2 * log(S)/ $); 
phase=1 - phase; 
return X; 
} 
这 些 方法 都 生成 均值 为 零 、 标 准 差 为 1 的 数字 。 【要 调整 到 其 他 分 布 ， 可 以 
乘 上 标准 差 再 加 上 均值 。) 方法 1 比较 差 〈 尤 其 是 NSUM 很 小 的 时 候 ) ， 但 方法 2 
和 方法 3 都 不 错 。 更 多 信息 可 以 参见 参考 资料 。 
参考 资料 : [21, Sec. 3.4.1 p.117] 
[25] 
[3] 
[1] 
[29, Sec. 7.2 pp. 288-290] 


13.21 


H: 我 在 移植 一 个 程序 ， 里 边 调 用 了 一 个 函数 drand48， 而 我 的 库 又 没有 这 
。 这 是 个 什么 函数 ? 
答 : UNIX System V 的 函数 drand48 返 回 半 开 区 间 [0,1) 内 的 浮 点 随机 数 〈 可 能 
为 48 位 精度 ) . 〈 和 和 它 对 应 的 种 子 函 数 是 srand48。 这 个 在 C 语 言 标准 中 也 没 
有 。) 可 以 很 容易 写 出 一 个 低 精 度 的 蔡 代 版 本 : 
#include<stdl ib. h> 
double drand48 () 
{ 


4 


return rand()/ (RAND MAX+1. ) ; 

} 

要 更 精确 地 模拟 drand48 的 语义 ， 可 以 试 试 给 它 提供 更 接近 48 位 的 精度 : 

#define PRECISION 2. 82e14 /* 2**48, rounded up */ 

double drand48 () 

{ 

double x=0; 
double denom=RAND_ MAX+1. ; 
double need; 
for (need=PRECISION; need>1; need /=(RAND MAX+1. )) 
{ 
xt=rand()/ denom; 
denom *=RAND_MAX+1. ; 
} 
return x; 

} 

但 是 在 使 用 这 样 的 代码 的 时 候 ， 要 注意 它 在 数学 上 是 有 些 可 疑 的 ， 尤 其 是 当 
rand 的 周期 和 RAND_MAX 是 同一 个 量 级 的 时 候 (通常 都 是 这 样 ) 。 (如 果 你 有 像 
BSD 的 random 函 数 那样 周期 更 长 的 随机 数 生 成 器 ， 那 么 在 模拟 drand48 的 时 候 请 一 
定 要 使 用 。) 

参考 资料 : [12, Sec. 11 p. 149] 


其 他 库 函数 


13.22 


: exit (status) « & 493K Ama ine ik A status Vr? 
: 参见 问题 11.18。 


1) ay 


13.23 


: memcpy 和 memmove 有 什么 区 别 ? 
: 参见 问题 11.27。 


I% sy 


13.24 


问 : 我 想 移植 这 个 旧 程 序 。 为 什么 报 出 这 些 “undefined external” 447k: 
index?、rindex?、bcopy?、bcmp?、bzero?? 
答 : 这 些 函 数 都 已 经 过 时 了 。 你 应 该 使 用 对 应 的 strchr、strrchr、 


memmove 《调换 前 两 个 参数 。 参 见 问题 11.27) 、memcmp、memset (将 第 二 个 参 
数 置 为 0) 。 

如 果 你 使 用 的 旧 系 统 缺 失 上 边 的 函数 ， 也 可 以 实现 这 些 函 数 来 蔡 换 问题 中 的 
那些 函数 。 

参见 问题 12.24 和 13.21。 

参考 资料 : [12, Sec. 11] 


问 : 我 不 断 得 到 库 函 数 未 定义 错误 ， 但 是 我 已 经 包含 了 所 有 用 到 的 头 文件 
了 。 


答 : 通常 ， 头 文件 只 包含 库 函 数 的 外 部 说 明 而 不 是 函数 本 身 。 头 文件 在 编译 
时 使 用 ， 而 库 文 件 用 在 连接 时 。 

某 些 情况 下 ， 尤 其 是 使 用 非 标准 函数 时 ， 你 可 能 需要 在 连接 时 指定 正确 的 函 
数 库 以 得 到 函数 的 定义 。 包 含 头 文 件 并 不 能 给 出 定义 。 (有 些 系统 可 能 会 在 连接 
的 时 候 自动 请 求 你 包含 的 头 文 件 对 应 的 非 标准 库 。 但 这 种 技术 应 用 还 不 广泛 。) 
参见 问题 10.11、11.32、13.26、14.3 和 19.45。 


13.26 


P: 虽然 我 在 连接 时 明确 地 指定 了 正确 的 函数 库 ， 我 还 是 得 到 库 函 数 末 定义 
错误 。 

答 : 许多 连接 器 只 对 目标 文件 和 你 明确 指出 的 函数 库 进行 一 次 扫描 ， 然 后 从 
函数 库 中 提取 适合 当前 未 定义 函数 的 模块 。 所 以 函数 库 和 对 象 文 件 〈 以 及 对 象 文 
件 之 间 〉 的 连接 顺序 很 重要 。 通 常 ， 你 都 应 该 最 后 再 搜索 函数 库 。 

例如 ， 在 UNIX 系 统 中 ， 这 样 的 命令 

cc -Im myprog. c # WRONG 

往往 不 行 。 应 该 把 -] 参 数 放 在 命令 行 的 最 后 。 

cc myprog.c -Im 

如 果 把 库 放 在 前 边 ， 编 译 器 就 不 知道 它 到 底 需 要 从 库 里 提取 哪些 模块 ， 因 而 
就 会 直接 跳 过 。 参 见 问题 13.28。 


13.27 


问 : 一 个 最 简单 的 程序 ， 不 过 在 一 个 窗口 里 打印 出 “Hello, Wor1d”， 为 什 
么 会 编译 出 巨大 的 可 执行 代码 ( 数 百 K) ? 我 该 少 包含 一 些 头 文件 吗 ? 

答 : 你 看 到 的 就 是 当前 的 函数 库 设 计 状 态 。 运 行 时 库 倾 向 于 汇集 越 来 越 多 的 
功能 (尤其 是 跟 图 形 用 户 界面 相关 的 ) 。 当 一 个 库 函 数 调用 另 一 个 库 函 数 来 完成 
它 的 部 分 功能 (这 本 是 件 好 事 ， 而 且 也 正 是 库 函 数 存在 的 原因 〉 时 ， 很 可 能 调用 
库 中 的 任何 一 个 函数 〈 尤 其 是 像 printf 那 样 功能 相对 强大 的 函数 ) 最 终 都 会 导致 对 
其 他 所 有 函数 的 调用 ， 从 而 生成 可 怕 的 巨大 代码 。 

包含 更 少 的 头 文件 恐怕 于 事 无 补 ， 因 为 仅仅 声明 一 些 不 会 调用 的 函数 (包含 


不 需要 的 头 文件 不 过 如 此 ) 并 不 会 导致 这 些 函 数 出 现在 可 执行 代码 中 ， 除 非 它们 
事实 上 被 调用 了 。 人 参见 问题 13.25。 
倒是 可 以 跟踪 一 下 导致 你 的 程序 代码 增 大 的 函数 链 ， 或 许可 以 向 厂商 投诉 一 


下 ， 让 他 们 整理 整理 这 些 库 。 
参考 资料 : [11, Sec. 4. 8.6 pp. 103-104] 
13.28 
问 : 连接 器 报告 end 未 定义 代表 什么 意思 ? 
答 : 这 是 个 老 UNIX 系 统 中 的 连接 器 所 用 的 俏皮 话 。 只 有 其 他 符号 还 未 定义 
时 ， 才 会 得 到 _end 未 定义 的 信息 。 解 决 了 其 他 的 问题 ， 有 关 _end 的 错误 信息 也 就 
会 消失 。 参 见 问题 13.25 和 13.26。 


13.29 


H: 我 的 编译 器 提示 pr intf 未 定义 ! 这 怎么 可 能 ? 

答 : 据 传 闻 ， 某 些 用 于 微软 视窗 系统 的 C 编 译 器 不 文 持 printf。 根 据 是 printf 用 
于 向 老式 终端 输出 ， 而 在 windows 下 显示 文本 的 正确 方法 是 调用 xxx 打 开 一 个 窗 
口 ， 然 后 再 调用 xxx 在 其 中 显示 文本 。 也 许可 以 让 这 样 的 编译 器 认为 你 写 的 是 “ 控 
制 台 程序 ”， 这 样 编译 器 会 打开 “控制 台 窗 口 ? 从 而 文 持 printf 。 


岂 L. 例 如 ， 早 期 的 C 编 译 器 和 连接 器 在 符号 表 中 使 用 8 个 字符 的 定 长 字符 串 ， 许 多 

版 本 的 UNIX 还 在 使 用 14 个 字符 长 的 文件 名 。strncpy 的 男 一 个 相关 的 怪癖 是 它 会 用 
多 个 '0' 填 充 短 串 ， 直 到 达到 指定 的 长 度 。 这 样 允 许 更 有 效 的 字符 串 比 较 。 只 要 比 
较 n 个 字 节 而 不 用 查找 '0'。 


21 而 且 ，strtok 在 一 系列 调用 中 依赖 于 一 些 内 部 的 状态 ， 所 以 不 是 可 重 入 函数 。 


[31. 也 可 以 将 正则 表达 式 的 处 理 下 放 到 别 的 程序 做 ， 例 如 grep 或 perl 写 的 脚本 。 参 
见 问题 19.35。 


[41. 这 个 版 本 的 mystructcmp 用 了 明确 的 比较 ， 而 不 是 更 明显 的 减法 ， 来 决定 返回 
负数 、 零 或 正 数 。 一 般 来 讲 ， 这 么 写 的 比较 函数 较 安 全 。 当 一 个 很 大 的 正 数 和 一 
个 很 小 的 负数 作 比 较 ， 减 法 很 容易 就 会 溢出 ， 从 而 导 至 程序 退出 或 得 到 错误 的 结 
果 。 当 然 在 这 个 例子 中 ， 溢 出 基本 上 是 不 会 出 现 的 。 


[5]1. 注 意 ， 根 据 文 献 [35]，time 有 可 能 失败 ， 返 回 (tiem_b(-1TD)。 


[6]. 这 些 指针 基本 上 是 早期 C 遗 留 下 来 的 。 在 long 型 发 明 以 前 ， 时 间 的 值 存 储 在 一 
个 含 两 个 int 型 的 数组 中 。 


[71. 更 精确 地 说 ， 从 那天 的 GMT 正 午 开 始 。 注 意 侨 略 日 数 跟 某 些 数据 处 理 时 用 
的 “ 癸 略 日 期 ”(Julian dates) 不 一 样 ， 而 且 都 和 儒 略 日 历 (Julian calendar) 无 
Ko 
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浮 点 运算 有 时 看 起 来 有 些 麻烦 和 神秘 。 在 C 语 言 中 这 个 问题 尤其 严重 一 些 ， 
因为 C 语 言传 统 上 并 不 是 用 来 设计 大 量 使 用 浮 点 数 的 程序 的 。 


14.1 


问 : 一 个 float 变 量 赋值 为 3. 1 时 ， 为 什么 printf 输 出 的 值 为 3. 0999999? 

答 : 大 多 数 电脑 都 是 用 二 进 制 来 表示 浮 点 数 和 整数 的 。 在 十 进 制 里 ，0.1 是 个 
简单 、 精 确 的 小 数 ， 但 是 用 二 进 制 表示 起 来 却 是 个 循环 小 数 0.0001100110011.…。 
所 以 3.1 在 十 进 制 内 可 以 准确 地 表达 ， 在 二 进 制 下 却 不 能 。 

在 对 一 些 二 进 制 中 无 法 精确 表示 的 小 数 进行 赋值 或 读 入 再 输出 时 ， 也 就 是 从 
十 进 制 转 成 二 进 制 再 转 回 十 进 制 ， 你 会 观察 到 数值 的 不 一 致 。 这 是 由 于 编译 器 二 
进 制 /十 进 制 转 换 例 程 的 精确 度 引 起 的 [1， 这 些 例 程 也 用 在 printf 中 。 参 见 问题 
14.6。 


14. 


N 


问 : 我 想 计算 一 些 平方 根 ， 我 把 程序 简化 成 这 样 : 

main () 

{ 

printf ("%f\n", sqrt (144. ) ) ; 

} 

可 得 到 的 结果 却 是 疯狂 的 数字 。 为 什么 ? 

答 : 确定 你 包含 了 二 math.h> 以 及 正确 地 将 其 他 相关 函数 的 返回 值 声 明成 了 
double 型 。( 另 外 一 个 需要 注意 的 库 函 数 是 atof， 其 原型 声明 在 stdlib.h 二 中 。) 
参见 问题 1.25、14.3 和 14.4。 


参考 资料 : [22, Sec. 4.5 pp. 65-66] 


jp 


4.3 


H: 我 想 做 一 些 简 单 的 三 角 函 数 运算 ， 也 包含 了 <math. h 之 ， 但 连接 器 总 是 
提示 sin、cos 这 样 的 函数 未 定义 。 为 什么 ? 

答 : 确定 你 真 的 连接 了 数学 函数 库 。 例 如 ， 在 UNIX 或 Linux 系 统 中 ， 有 一 个 
存在 了 很 久 的 bug， 你 需要 把 参数 -Im 加 在 编译 或 连接 命令 行 的 最 后 。 参 见 问题 
13.25、13.26 和 14.2。 


14. 


= 


问 : 我 的 浮上 点数 计算 程序 表现 得 很 奇怪 ， 在 不 同 的 机 器 上 给 出 了 不 同 的 结 
果 。 为 什么 ? 
答 : 首先 阅读 问题 14.2。 
如 果 问 题 并 不 是 那么 简单 ， 那 么 回想 一 下 ， 计 算 机 一 般 都 是 用 一 种 浮 点 的 格 
式 来 近似 地 模拟 实数 算术 运算 ， 注 意 是 近似 ， 而 不 是 完全 精确 。 计 算 机 浮 点 数 运 
算 的 结合 律 和 分 配 并 不 一 定 完全 成 立 。 也 就 是 说 ， 运 算 顺 序 可 能 会 影响 结果 ， 而 
连 加 也 不 一 定 和 乘法 等 价 。 下 溢 、 误 差 的 累积 和 其 他 非常 规 性 是 常见 的 麻烦 。 
不 要 假设 浮 点 运算 结果 是 精确 的 ， 尤 其 不 能 直接 比较 两 个 浮 点 数 是 否 相 等 。 
《也 不 要 随意 地 引入 “模糊 因子 ”。 参 见 问题 14.5。) 有 的 机 器 的 浮 点 运算 寄存 器 
的 精度 可 能 比 内 存 中 的 double 值 还 高 ， 这 可 能 会 导致 某 些 看 上 去 确实 相等 的 浮 点 
数 并 不 相等 。 
这 也 并 不 是 C 语 言 特有 的 问题 ， 其 他 程序 设计 语言 有 同样 的 问题 。 浮 点 运算 
的 某 些 方面 被 通常 定义 为 “CPU 的 任何 处 理 方法 ”( 参 见 问 题 11.35 和 11.37〉; 否则 
在 没有 “正确 ” 浮 点 模型 的 处 理 器 上 ， 编 译 器 要 被 迫 进行 代价 非凡 的 仿真 。 
本 书 不 打算 列举 在 处 理 浮 点 运算 上 的 潜在 难点 和 合适 的 做 法 。 有 其 他 数字 编 
程 方面 的 好 书 会 涵盖 基本 的 知识 。 参 见 下 面 的 参考 资料 。 
参考 资料 : [17, Sec. 6 pp. 115-118] 
[21, Volume 2 chapter 4] 
[10] 


14.5 


问 : 有 什么 好 的 方法 来 检查 浮 点 数 在 “足够 接近 ”情况 下 的 相等 ? 

答 : 浮 点 数 的 定义 决定 它 的 绝对 精度 会 随 着 其 量 级 而 变化 ， 所 以 比较 两 个 浮 
点 数 的 最 好 方法 就 要 利用 一 个 与 浮 点 数 的 量 级 相关 的 精确 闪 值 。 不 要 用 下 面 这 样 
的 代码 : 

double a,b; 


if (a==b) /* WRONG */ 

要 用 类 似 这 样 的 方法 : 

#include<math. h> 

if (fabs (a - b) <=epsilon * fabs (a)) 

epsilon 被 赋 为 一 个 特定 的 值 来 控制 “接近 度 ”。 选 择 epsilon 的 值 也 要 小 心 : 它 
的 合适 值 可 能 很 小 、 只 与 机 器 的 浮 点 精度 相关 ;如 果 被 比较 的 值 本 来 精度 就 不 
高 ， 或 者 是 连续 和 运算、 误差 累积 的 结果 ， 这 个 值 也 可 以 定 得 稍 大 。 也 要 确保 a 不 会 
AO. 当然， 也 可 以 用 b 或 者 b 和 a 的 函数 来 作为 阔 值 。) 

用 绝对 病 值 的 方法 肯定 要 拳 些 ， 通 常 也 不 推荐 : 

if (fabs (a - b) <0. 001) /* POOR */ 

0.00112 FF HY Aa ot OR A ER TE DA ESE OC EE A ES TL, 
很 有 可 能 两 个 较 小 的 、 本 应 看 作 不 相等 的 数 正 好 相差 小 于 0.001， 而 两 个 本 应 看 作 
相等 的 两 个 大 数 却 相差 大 于 0.001。〔 显 然 ， 将 模糊 因子 修改 为 0.005 或 者 0.0001 或 
其 他 任何 绝对 数 都 无 助 于 解决 这 个 问题 。) 

Doug Gwyn 推 荐 使 用 下 面 的 “相对 差 ? 函 数 。 它 返回 两 个 实数 的 相对 差 值 ， 如 
果 两 个 数 完全 相同 ， 则 返回 0.0， 和 否则 ， 返 回 差 值 和 较 大 数 的 比值 : 

#define Abs (x) ((x) <0 ? -(x): (x)) 

#def ine Max (a, b) ((a) > (b)? (a): (b)) 

double RelDif (double a, double b) 

{ 


double c=Abs (a) ; 
double d=Abs (b) ; 


d=Max (c, d) ; 
return d==0.0 ? 0.0 : Abs(a - b)/ d; 
} 
典型 的 用 法 是 : 
if (RelDif (a, b) <=TOLERANCE)... 
参考 资料 : [21, Sec. 4.2.2 pp. 217-218] 


14. 


问 : 怎样 取 整 ? 

答 : 最 简单 、 直 接 的 方法 是 使 用 这 样 的 代码 : 

(int) (x+0. 5) 

C 语 言 的 浮 点 数 到 整数 的 转换 会 去 掉 小 数 部 分 ， ee 5 会 使 
>0.5 的 小 数 部 分 进位 。 但 是 这 个 方法 对 于 负数 并 不 有 效 。 这 是 一 个 改进 的 方法 : 

(int) (x<0 ? x- 0.5 : x+0.5) 

要 保留 到 特定 的 精度 ， 可 以 使 用 : 

(int) (x / precision+0.5)* precision 

处 理 负数 或 按 奇 / 偶 取 整 的 实现 需要 一 些 技巧 。 

注意 ， 因 为 取 整 的 默认 方法 是 截断 ， 因 此 通常 在 将 浮 点 数 转换 为 整数 的 时 候 
最 好 都 使 用 显 式 的 取 整 步骤 。 一 不 小 心 ， 就 有 可 能 将 你 认为 的 8.0 转 成 了 7， 因 为 
它 的 内 部 表示 可 能 是 7.999999。 


14.7 


问 : 为 什么 6 语言 不 提供 乘 寺 的 操作 符 ? 
答 : 一 个 原因 可 能 是 几乎 没有 什么 处 理 器 提供 乘 贤 指令 。C 语 言 有 一 个 标准 
函数 pow《〈 在 <math.h> 中 声明 ) ， 可 以 用 来 计算 乘 荔 。 但 对 于 小 的 正 整 数 指 
数 ， 直 接 用 乘法 一 般 都 会 更 好 [2]。 换 言 之 ，pow(X,2.) 恕 怕 不 如 x * x。〔 如 果 你 想 
创建 一 个 Square0 宏 ， 请 先 参考 问题 10.1。 ) 
参考 资料 : [35, Sec. 4.5.5.1] 
[8, Sec. 7.5.5.1] 


[11, Sec. 17.6 p. 393] 
14.8 


H: At ARME EM <math. h> KAM LH SM Pl? 

答 : 这 个 常量 〈 它 应 该 是 定义 准确 到 机 器 精度 的 r 值 ) 不 包含 在 标准 内 。 事 
实 上 ， 符 合 标准 的 入 mathh> 不 应 该 定义 符号 M_PI。[3] 如 果 你 要 用 到 r， 需 要 自 
己 定 义 ， 或 者 用 4*atan(1.0) 或 acos(-1.0) 计 算出 来 。〈 可 以 使 用 下 面 这 样 的 构造 来 
确保 只 有 系统 头 文件 没有 提供 的 时 候 才 定义 。) 

#ifndef MPI 

#define M PI 3. 1415926535897932385 

#end if 

参考 资料 : [12,Sec.13 p.237] 


14.9 


问 : 怎样 将 变量 置 为 IEEE NaN (“Not a Number” ) 或 检测 变量 是 否 为 NaN 


及 其 他 特殊 值 ? 
答 : 许多 实现 高 质量 IEEE 浮 点 的 系统 会 提供 简洁 的 工具 去 处 理 这 些 特殊 值 。 


例如 ， 在 二 math.h 过 或 者 <ieee.h 过 或 <nan.h> 以 非 标准 扩展 提供 预定 义 常量 及 像 
isnan() 这 类 的 函数 。 这 些 工具 的 标准 化 进程 正在 进行 中 。[4 一 个 简陋 但 通常 有 效 
的 测试 NaN 的 方法 如 下 : 

#define isnan(x) ((x) !=(x)) 

虽然 一 些 不 支持 IEEE 的 编译 器 可 能 会 把 这 个 判断 优化 掉 。〔 就 算 你 有 预定 义 
的 NAN 宏 ， 也 不 能 用 它 来 这 样 比较 : if(x==NAN)， 因 为 一 个 NaN 不 一 定 和 另 一 个 
相等 。) 

必要 时 ， 还 可 以 用 sprintf 格 式 化 需 测试 的 值 ， 在 许多 系统 上 ， 它 会 产 
生 “NaN” 或 “Inf” 的 字符 串 。 你 就 可 以 比较 了 。 

要 将 变量 初始 化 为 这 些 值 (而 你 的 系统 又 没有 提供 明确 的 解决 方案 〉 ， 可 以 
使 用 一 些 编译 时 “算术 ”来 迁 回 一 下 : 

double nan=0. /0; 


double inf=1. /0; 

BERZET, BOR EN BVA es mn Tan, th NEN Tit 

《设置 这 些 特殊 值 最 可 靠 的 办 法 是 采用 它们 的 内 部 二 进 制 表达 ， 但 用 二 进 制 
值 初始 化 浮 点 数 需 要 用 到 联合 或 者 其 他 的 双关 语义 的 方法 ， 而 这 显然 是 机 器 相关 
的 。) 

参见 问题 19.44。 

参考 资料 : [9, Sec. 7.7.3] 


14.10 
问 : 如 何 简洁 地 处 理 浮 点 异常 ? 
答 : 参见 问题 19.44。 

14.11 


问 : 在 0 语言 中 如 何 很 好 地 实现 复数 ? 

B, 这 其 实 非常 直接 ， 定 义 一 个 简单 结构 和 相关 的 算术 函数 就 可 以 了 [51]。 这 
是 一 个 简单 的 例子 ， 可 以 让 你 感受 一 下 : 

typedef struct { 


double real; 
double imag; 
} complex; 
#define Real (c) (c). real 
#define Imag (c) (c). imag 
complex cpx make (double real, double imag) 
{ 
complex ret; 
ret. real=real; 
ret. imag=imag; 


return ret; 


complex cpx_add(complex a, complex b) 
{ 
return cpx make (Real (a)+Real (b), Imag (a) +Imag (b) ) ; 
} 
可 以 这 样 使 用 这 些 函数 : 
complex a=cpx_make (1, 2) ; 
complex b=cpx_make (3, 4) ; 
complex c=cpx_add (a, b) ; 
或 者 ， 更 简单 地 : 
complex c=cpx add (cpx_ make (1, 2), cpx_make (3, 4)) ; 
C99 在 标准 中 支持 复数 类 型 。 参 见 问题 2.8、2.11 和 14.12。 
参考 资料 : [9, Sec. 6. 1. 2.5, Sec. 7.8]。 


14.12 


问 : een 实现 以 下 功能 的 ees 快速 傅立叶 变换 (FFT) 、 
矩阵 算术 (乘法 、 求 逆 等 函数 ) 、 pp 

答 : Ajay eee 算术 软件 列表 。 这 个 列表 在 互联 网 上 有 免费 的 
在 线 版 ， 并 且 定 期 更 新 。 其 中 一 个 URL 是 ftp:/ftp.math.psu.edupub/FAQ/numcomp- 
free-c。 人 参见 问题 18.9、18.13、18.18 和 18.20。 


14.13 


问 : Turbo CARA, ETARA “floating point formats not 
linked” 〈 浮 点 格式 未 连接 ) 。 我 还 缺点 儿 什 么 呢 ? 

答 : 一 些 在 小 型 机 器 上 使 用 的 编译 器 ， 包 括 Turbo C (和 Richie 最 初 用 在 PDP- 
11 上 的 编译 器 ) ， 编 译 时 会 急 略 掉 某 些 它 认为 不 需要 的 浮 点 文 持 。 特 别 是 用 非 浮 
点 版 的 printf 和 scanf 以 节省 一 些 空 间 ， 也 就 是 忽略 处 理 %e、%f 和 %g 的 编码 。 

然而 ，Borland 用 来 确定 程序 是 否 使 用 了 浮 点 运算 的 探测 法 并 不 充分 ， 程 序 员 
有 时 必须 调用 一 个 空 浮 点 库 函 数 〈 例 如 sqrt， 或 任何 一 个 函数 都 可 以 ) 以 强制 装 
载 浮 点 文 持 。 


在 某 些 MS-DOS 的 编译 器 下 如 果 连 接 了 错误 的 浮 点 库 也 会 导致 类 似 的 错误 信 
i, CQl“floating point not loaded”) 。 关 于 各 种 浮 点 库 ， 可 以 参考 编译 器 手册 的 描 
参见 comp.os.msdos.programmer FAQ 以 获取 更 多 信息 。 


[1 二进制 浮 点 数 与 十 进 制 之 间 的 精确 转换 是 个 很 有 意思 的 问题 。 参 考 文献 中 列 出 
了 Clinger、Steele 和 White 发 表 的 两 篇 优秀 论文 。 


[2 特别 是 ， 有 的 pow 实 现 对 两 个 整数 参数 不 一 定 能 给 出 正确 结果 。 例 如 ， 某 些 系 
统 上 ，(int)pow(2.,3.) 会 因为 取 整 的 原因 返回 7。 参 见 问题 14.6。 


[31. 这 涉及 “命名 空间 ”污染 的 问题 。 参 见 问 题 1.30。 
[41.C99 提 供 了 isnan()、fpclassify0) 及 其 他 一 些 类 似 的 例 程 。 一 一 译 者 注 


[51L 在 C++ 中 这 些 操作 更 加 直接 。 


第 15 章 可 弯 参 数列 表 


C 语 言 提 供 了 一 种 未 被 广泛 理解 的 机 制 ， 可 以 允许 函数 接受 数量 可 变 的 参 
数 。 可 变 参 数列 表 相 对 较 少 ， 但 在 C 语 言 的 printf 函 数 和 相关 的 情形 下 却 很 重要 。 
(可 变 参 数列 表 尤 其 麻烦 在 于 ， 只 有 在 ANSI C 标 准 中 它 才 得 以 正式 支持 。 严 格 地 
讲 ， 此 前 它 是 未 定义 的 。) 

可 变 参 数列 表 相 关 的 术语 可 能 有 些 复杂 。 形 式 上 ， 一 个 可 变 参 数列 表 包 含 两 
个 部 分 : 固定 部 分 和 可 变 部 分 。 因 此 我 们 可 能 会 使 用 夸大 其 词 的 * 可 变 参 数列 表 的 
可 变 部 分 ”这 样 的 表达 方式 。〔 你 也 会 看 到 “ 变 参 的 ”(variadic 或 variargs〉 这样 的 
描述 : 表示 “有 可 变数 量 参数 的 "。 因 此 ， 我 们 也 可 能 提 到 “ 变 参 函 数 ” 或 “可 变 参 
数 ”。) 

处 理 可 变 参 数列 表 需 要 3 个 步骤 。 首 先 声 明 一 个 特殊 的 va_list 类 型 的 “指针 ? 变 
量 并 用 va_start 将 它 初始 化 为 指 辣 参数 列表 的 开头 。 然 后 ， 通 过 调用 va_arg 从 可 变 
参数 列表 中 获取 参数 。va_arg 使 用 va_list 指 针 和 需要 获取 的 参数 的 类 型 作为 参数 。 
最 后 ， 完 成 所 有 的 处 理 之 后 ， 调 用 va_end 进 行善 后 处 理 。 (将 va_list“ 指 针 ” 放 入 引 
号 中 是 因为 它 未 必 是 真正 的 指针 ，va_list 是 一 个 封装 了 实际 数据 结构 的 类 型 定 
义 。) 

变 参 函数 可 能 使 用 与 传统 的 固定 参数 函数 不 同 的 特殊 调用 机 制 。 因 此 ， 在 调 
用 变 参 函 数 之 前 必须 有 函数 原型 (参见 问题 15.1) 。 然 而 ， 一 个 原型 显然 不 能 
示 可 变 参数 的 个 数 和 类 型 。 因 此 ， 可 变 参 数 会 进行 “默认 参数 提升 ”( 参 见 问 题 
15.2) ， 而 且 也 不 会 执行 类 型 检查 。 (参见 问题 15.3。) 


a a 


调用 变 参 函数 


15.1 


问 : 为 什么 调用 printf 前 必须 要 包含 之 stdio.h>>? 
答 : 为 了 把 printf 的 正确 原型 说 明 引 入 作用 域 。 
对 于 用 可 变 参 数 的 函数 ， 编 译 器 可 能 用 不 同 的 调用 次 序 。 例 如 ， 如 果 可 变 参 
数 的 调用 比 固 定 参 数 的 调用 效率 低 ， 编 译 器 就 可 能 这 样 做 。 所 以 在 调用 可 变 参数 
的 函数 前 ， 它 的 原型 说 明 必 须 在 作用 域内 ， 编 译 器 由 此 知道 要 用 可 变 参数 调用 机 
制 。 在 原型 说 明 中 用 省 略 号 “...” 来 表示 可 变 参数 。 
参考 资料 : [8, Sec. 6. 3. 2. 2, Sec. 7.1.7] 
[14, Sec. 3. 3. 2. 2, Sec. 4. 1. 6] 
[11, Sec. 9. 2. 4 pp. 268-269, Sec. 9.6 pp. 275-276] 


15.2 


H: 为 什么 %f 可 以 在 printf 参 数 中 同时 表示 float 和 double? 它们 难道 不 是 
不 同类 型 吗 ? 

答 : 可 变 参数 的 可 变 部 分 使 用 “默认 参数 提升 *，char 和 shortint 提 升 到 int， 
float 提 升 到 double。 同 样 的 提升 也 适用 于 作用 域 中 没有 原型 说 明 的 函数 调用 ， 即 
所 谓 的 “ 旧 风 格 ” 函 数 调 用 ， 参 见 问题 11.4。 所 以 printf 的 %f 格 式 总 是 得 到 double。 
类 似 地 ，%c 总 是 得 到 int，%hd 也 是 。 参 见 问 题 12.9 和 12.15。 

参考 资料 : [35, Sec. 3. 3. 2. 2] 

[8, Sec. 6. 3. 2. 2] 
[11, Sec. 6.3.5 p. 177, Sec. 9.4 pp. 272-273] 


15.3 


H: 我 遇 到 了 一 个 令 人 十 分 受挫 的 问题 ， 后 来 发 现 是 这 行 代 码 造 成 的 : 

printf ("%d", n) ; 

原来 n 是 longint 型 。 难 道 ANS1 的 函数 原型 不 就 是 用 来 防止 这 类 的 参数 类 型 不 
匹配 吗 ? 

答 : 当 一 个 函数 用 可 变 参 数 时 , 它 的 原型 说 明 没有 也 不 能 提供 可 变 参 数 的 数目 
和 类 型 。 所 以 通常 的 参数 匹配 保护 机 制 不 适用 于 可 变 参数 中 的 可 变 部 分 。 编 译 器 
不 能 执行 默认 的 类 型 转换 ， 而 且 《〈 一 般 ) 也 不 能 警告 不 匹配 问题 。 程 序 员 必 须 自 
己 确 保 参数 类 型 的 匹配 或 者 手工 加 入 强制 的 类 型 转换 。 

对 于 printf 型 的 函数 ， 如 果 格 式 串 是 个 字符 串 字 面 量 ， 有 些 编译 器 (包括 
gcc) 和 某 些 版 本 的 lint 可 以 检查 实际 的 参数 和 字符 串 是 否 匹 配 。 

参见 问题 5.2、11.4、12.9 和 15.2。 


15.4 


H: 怎样 写 一 个 接受 可 变 参数 的 函数 ? 答 : 用 <<stdarg.h> 提 供 的 辅助 机 
制 。 

下 面 这 个 函数 把 任意 个 字符 串 拼接 起 来 ， 将 结果 放 在 动态 分 配 的 内 存 中 : 
#include<stdlib.h>/* for malloc, NULL, size 七 */ 
#include<stdarg.h>/* for va stuff */ 

#include<string.h>/* for strcat et al. */ 


char *vstrcat (const char *first,...) 
{ 

size_t len; 

char *retbuf ; 

va_list argp; 

char *p; 

if (f irst==NULL) 

return NULL; 

len=strlen (first); 

va_start(argp, first); 

while ((p=va_arg(argp, char *)) !=NULL) 


lent=strlen(p) ; 
va_end (argp) ; 
retbuf=mal loc(lent+1); /*+1 for trailing NO */ 
if (retbuf==NULL) 
return NULL; /* error */ 
(void) strcpy (retbuf, first) ; 
va_start(argp, first); /* restart; for second scan */ 
while ((p=va_arg(argp, char *)) !=NULL) 
(void) strcat (retbuf, p) ; 
va_end (argp) ; 
return retbuf; 


} 
(注意 第 二 次 va_start 调 用 用 于 第 二 次 处 理 参 数列 表 时 重新 扫描 。va_end 的 调 
用 也 值得 注意 : 就 算 它 们 看 起 来 什么 也 没有 做 ， 但 对 于 可 移植 性 ， 这 也 很 重 
要 。) 
对 vstrcat 的 调用 如 下 : 
char *str=vstrcat ("Hello,", "world!", (char *) NULL) ; 
注意 最 后 一 个 参数 的 类 型 转换 。 参 见 问题 5.2 和 15.3。 《同时 注意 调用 者 要 各 
放 返 回 的 存储 空间 ， 那 是 用 malloc 分 配 的 。) 
前 面 例子 里 的 函数 接受 的 参数 个 数 可 变 ， 但 所 有 的 参数 类 型 都 是 一 样 的 char 
*。 下 边 的 例子 接受 不 同类 型 的 可 变 参 数 。 这 是 一 个 简化 的 printf 函 数 。 注 意 每 次 
调用 va_arg() 函 数 都 会 指明 要 从 参数 列表 中 获取 的 参数 的 类 型 。 
Cminiprintf 函 数 使 用 了 问题 20.11 中 的 baseconv 函 数 来 格式 化 数字 。 由 于 不 一 
定 能 够 正确 地 打印 最 小 的 整数 INT_MIN， 这 个 函数 显得 很 不 完美 。) 
#include<stdio. h> 
#include<stdarg. h> 


extern char *baseconv (unsigned int, int) ; 


void 
miniprintf (const char *fmt,...) 


{ 


const char *p; 
int 1; 
unsigned u; 
char *s; 
va_list argp ; 
va_start(argp, fmt) ; for (p=fmt; *p !='\0 '; pt+) { 
if (Ap !='%') { 
putchar (*p) ; 
continue; 
} 
switch (#++p) { 
case 'c': 
i=va_arg(argp, int); 
/* not va_arg(argp, char); see Q 15.10 */ 
putchar (i) ; 
break; 
case'd': 
i=va_arg(argp, int); 
if (i <0) { 
/* XXX won't handle INI_MIN */ 
1= 一 | ; 
putchar ('-') ; 
} 
fputs (baseconv (i, 10), stdout) ; 
break; 
case 'o': 
u=va_arg(argp, usigned int); 
fputs (baseconv (u, 8), stdout) ; 
break; 


case 's': 


s=va_arg(argp, char *); 
fputs (s, stdout) ; 
break; 

case 'u': 
u=va_arg(argp, unsigned int); 
fputs (baseconv (u, 10), stdout) ; 
break ; 

case 'x': 
u=va_arg(argp, unsigned int); 
fputs (baseconv (u, 16), stdout) ; 
break; 

case '%': 
putchar ('%') ; 


break; 


} 
va_end(argp) ; 
} 
参见 问题 15.7。 
参考 资料 : [19, Sec. 7. 3 p. 155, Sec. B7 p. 254] 
[35, Sec. 4. 8] 
[8, Sec. 7. 8] 
[14, Sec. 4. 8] 
[11, Sec. 11.4 pp. 296-299] 
[22, Sec. A. 3 pp. 139-141 ] 
[12, Sec. 11 pp. 184-185, Sec. 13 p. 242] 


15.5 


H: 怎样 写 一 个 函数 ， 像 pr intf 那 样 接受 一 个 格式 串 和 可 变 参 数 ， 然 后 再 把 
参数 传 给 pr intf 去 完成 大 部 分 工作 ? 


答 : 使 用 vprintf、vfprintf 或 vsprintf。 这 几 个 函数 跟 对 应 的 printf、fprintf 和 
sprintf 很 类 似 ， 只 是 他 们 接受 单独 的 va_list 指 针 而 不 是 可 变 参数 列表 。 

例如 ， 下 面 是 一 个 error 函 数 ， 它 打印 出 一 个 出 错 信息 ， 在 信息 前 加 入 字符 
串 “error:” 并 在 信息 后 加 入 换行 符 : 

#include<stdio. h> 

#include<stdarg. h> 


void error (const char *fmt,...) 

{ 
va_list argp; 
fprintf(stderr, "error: "); 
va_start(argp, fmt) ; 
vfprintf (stderr, fmt, argp) ; 
va_end (argp) ; 
fprintf(stderr, "\n") ; 


} 
参见 问题 15.7。 
参考 资料 : [19, Sec. 8.3 p. 174, Sec. B1. 2 p.245] 


[35, Secs. 4. 9. 6.7, 4.9.6.8, 4.9.6.9] 
[8, Secs. 7. 9. 6. 7, 7. 9. 6. 8, 7. 9. 6. 9] 
[11, Sec. 15.12 pp. 379-380] 

[12, Sec. 11 pp. 186-187] 


m 
(Sg 
(=p) 


H: 怎样 写 类 似 scanf 的 函数 ， 再 把 参数 传 给 scanf 去 完成 大 部 分 工作 ? 
答 : C99 支 持 vscanf、vfscanf 和 vsscanf，C99 以 前 的 标准 不 支持 。 
参考 资料 : [9, Secs. 7. 3. 6. 12-14] 


= 


3.7 


问 : 我 用 的 是 ANS1 前 的 编译 器 ， 没 有 <stdarg. h> 文 件 。 我 该 怎么 办 ? 


B: NE ASL CHE <varargs.h> $e ttt SJL REINA. EA < 
varargs.h 之 提供 的 函数 重 写 的 问题 15.4 中 的 vstrcat 函 数 : 

#include<stdio. h> 

#include<varargs. h> 

#include<string. h> 


extern char *malloc(Q; 


char *vstrcat (va_list) 
va_dcl /* no semicolon */ 
{ 
int len=0; 
char *retbuf ; 
va_list argp; 
char *p; 
va_start(argp) ; 
whi le ((p=va_arg(argp, char *)) !=NULL) /* includes first */ 
lent=strlen(p) ; 
va_end (argp) ; 
retbuf=mal loc (len+1); /*+1 for trailing \0 */ 
if (retbuf==NULL) 
return NULL; /* error */ 
retbuf [0]='\0' ; 
va_start(argp); /* restart for second scan */ 
while ((p=va_arg (argp, char*) ) !=NULL) 
strcat (retbuf, p) ; 
va_end (argp) ; 
return retbuf; 
} 
(注意 va_ddl 后 边 没 有 分 号 ， 而 且 这 里 也 不 需要 对 第 一 个 参数 进行 特殊 处 
里。) 你 也 可 以 自己 声明 字符 串 函 数 而 不 必 使 用 <stingh>。 
如 果 你 能 找到 有 vfprintf 函 数 而 没有 二 stdarg.h 二 的 系统 ， 那 么 下 边 是 个 使 用 < 


vH 


varargs.h 之 的 error 函 数 〔( 问 题 15.5) 版 本 。 
#include<stdio. h> 
#include<varargs. h>void error (va alist) 
va_dcl /* no semicolon */ 
{ 
char *fmt; 
va_list argp; 
fprintf(stderr, "error: "); 
va_start(argp) ; 
fmt=va arg (argp, char *); 
vfprintf (stderr, fmt, argp) ; 
va_end (argp) ; 
fprintf(stderr, "\n") ; 


de HY BY ABB 


15.8 


H: 怎样 知道 实际 上 有 多 少 个 参数 传 入 函数 ? 答 : 这 一 段 信息 不 可 移植 。 一 
些 旧 系统 提供 一 个 非 标 准 函 数 nargs。 然 而 它 的 可 信 度 值得 怀疑 ， 因 为 它 的 一 般 
返回 值 是 参数 的 字 节 长 度 ， 而 不 是 参数 的 个 数 。 结 构 、 整 数 和 浮 点 类 型 的 值 一 般 
需要 几 个 字 节 的 长 度 。 

任何 接收 可 变 参 数 的 函数 都 应 该 可 以 从 传 入 的 参数 本 身 来 得 到 参数 的 数目 。 
类 printf 函 数 从 格式 串 中 的 格式 说 明 符 来 确定 参数 个 数 ， 例 如 %d 这 样 的 格式 说 明 
符 。 所 以 如 果 格 式 串 和 参数 数目 不 符 时 ， 此 类 函数 会 错 得 很 离谱 。 

还 有 一 个 常用 的 技巧 ， 如 果 所 有 的 参数 是 同一 个 类 型 ， 可 以 在 参数 列表 最 后 
加 一 个 标识 值 (通常 用 0、-1 或 转换 成 适当 类 型 的 空 指针 ) 。 参 见 问题 5.2 和 15.4 
例子 中 exec1 和 vstrcat 的 用 法 。 

最 后 ， 如 果 类 型 是 可 预见 的 ， 可 以 加 一 个 对 参数 数目 进行 计数 的 参数 。 当 然 
调用 者 通常 是 很 不 喜欢 这 种 做 法 的 。 

参考 资料 : [12, Sec. 11 pp. 167-168] 


15.9 


问 : 为 什么 编译 器 不 允许 我 定义 一 个 没有 固定 参数 项 的 可 变 参 数 函 数 ? 

答 : 标准 C 要 求 用 可 变 参 数 的 函数 至 少 有 一 个 固定 参数 项 ， 这 样 才 可 以 使 用 
va_start。 所 以 编译 器 不 会 接受 下 面 这 样 定 义 的 函数 : 

int f(...) 


} 


参见 问题 15.10。 


参考 资料 : [8, Sec. 6.5.4, Sec. 6.5. 4. 3, Sec. 7. 8.1.1] 
[11, Sec. 9.2 p. 263] 


15.10 


问 : 我 有 个 接受 float 型 的 变 参 函数 ， 为 什么 va_arg(argp, float) 却 不 行 ? 
答 : “默认 参数 提升 ?规则 适用 于 在 可 变 参 数 中 的 可 变 部 分 : 参数 类 型 为 float 
的 总 是 提升 到 double，char 和 shortint 提 升 到 int。 所 以 va_arg(arpg,float) 是 错误 的 用 
法 。 应 该 使 用 va_arg(arpg,double)。 同 理 ， 要 用 va_arg(argp,int) 来 取得 原来 类 型 是 
char、short 或 int 的 参数 。 基 于 同样 的 理由 ， 传 给 va_start 的 最 后 一 个 “固定 ”参数 项 
的 类 型 不 会 被 提升 。 参 见 问 题 11.4 和 15.2。 
参考 资料 : [8, Sec. 6. 3. 2. 2] 
[14, Sec. 4. 8. 1. 2] 
[11, Sec. 11.4 p. 297] 


15.11 


hl: At Ava_arg Ah Ae 172] KAA B48 a 9 BK? 
答 : 试 试用 typdef 定 义 函数 指针 类 型 。 
va_arg 宏 所 用 的 类 型 重 写 技巧 对 函数 指针 这 类 过 度 复 杂 的 类 型 有 些 力 不 从 
心 。 例 如 ， 这 是 一 个 简化 的 va_arg 宏 的 定义 : 
#define va arg (argp, type) \ 
(* (type *) (((argp)+=sizeof (type))- sizeof (type))) 
这 里 ，argp(va_list) 的 类 型 是 char *。 当 你 这 样 调用 时 ， 


va_arg(argp, int (*) ()) 

展开 的 结果 是 : 

(KCint (*) O*) (((argp)+=sizeof (int (*) 0))- sizeof (int (*) Q))) 

而 这 在 语法 上 是 错误 的 (第 一 个 (int(*)0*) 类 型 转换 没有 意义 。〉[1] 但 是 如 果 
用 typedef 定 义 一 个 函数 指针 类 型 ， 那 就 一 切 正常 了 。 例 如 ， 定 义 

typedef int (*funcptr) (); 

则 


va arg (argp, funcptr) 
会 扩展 为 
(*(funcptr *) (((argp)+=sizeof (funcptr))— sizeof (funcptr) )) 
这 就 没有 问题 了 。 
参见 问题 1.13、1.17 和 1.21。 
参考 资料 : [35, Sec. 4. 8.1.2] 
[8, Sec. 7.8.1.2] 
[14, Sec. 4. 8. 1. 2] 


困难 的 问题 


正如 我 们 所 见 ， 可 以 在 运行 时 分 离 可 变 参数 列表 。 但 是 要 创建 它们 却 只 能 在 
编译 阶段 。《 严 格 地 讲 ， 没 有 什么 真正 的 可 变 参 数列 表 ， 每 个 实际 的 参数 列表 都 
有 固定 数量 的 参数 。 变 参 函 数 只 不 过 可 以 在 每 次 调用 时 接受 不 同 长 度 的 参数 列 
表 。) 要 用 运行 时 创建 的 参数 列表 来 调用 函数 ， 你 就 没有 什么 可 移植 的 方法 了 。 


15.12 


H: 怎样 实现 一 个 可 变 参 数 函 数 ， 它 把 参数 再 传 给 另 一 个 可 变 参 数 函 数 ? 

答 : 通常 来 说 做 不 到 。 理 想 情 况 下 ， 你 应 该 提供 另 一 个 版 本 的 函数 ， 这 个 函 
数 接受 va_list 指 针 类 型 的 参数 。 

假设 你 想 写 一 个 faterror 函 数 ， 用 来 显示 严重 错误 信息 然后 退出 。 你 可 能 想 在 
问题 15.5 中 的 error 函 数 基础 上 来 写 : 

void faterror (const char *fmt,...) 

{ 

error (fmt, 这 里 发 生 什 么 ? ); 
exit (EXIT_FAILURE) ; 

} 

但 却 不 知道 怎样 将 faterror 的 参数 再 传 给 error。 

这 样 做 : 首先 将 现存 的 error 函 数 分 解 成 一 个 新 的 verror， 后 者 接受 一 个 单独 的 
va_list 指 针 而 不 是 可 变 参数 列表 。 (这 样 做 几乎 不 需要 付出 什么 额外 的 努力 ， 
为 verror 包 含 了 error 原 来 的 多 数 代 码 ， 而 新 的 error 函 数 不 过 是 对 verror 的 封装 而 
Een) 

#include<stdio. h> 

#include<stdarg. h> 

void verror (const char *fmt, va_list argp) 


{ 


fprintf(stderr, "error: "); 
vfprintf (stderr, fmt, argp ); 
fprintf(stderr, "\n") ; 


} 
void error (const char *fmt,...) 
{ 
va_list argp; 
va_start(argp, fmt) ; 
verror (fmt, argp) ; 
va_end (argp) ; 
} 


现在 你 就 可 以 让 faterror 也 调用 verror 了 : 
#include<stdl ib. h> 
void faterror (const char *fmt,...) 
{ 
va_list argp ; 
va_start(argp, fmt) ; 
verror (fmt, argp) ; 
va_end (argp) ; 
exit (EXIT_FAILURE) ; 
} 
error 和 verror 之 间 的 关系 跟 printf 和 vprintf 之 间 的 关系 完全 类 似 。 实 际 上 ， 正 如 
ChrisTorek 观 察 得 到 的 结论 ， 任 何 时 候 你 准备 写 变 参 函数 的 时 候 ， 写 出 两 个 版 本 
都 是 一 个 好 主意 。 一 个 函数 〈 像 verror 那 样 ) 接受 va_list 参 数 ， 完 成 所 有 的 工作 。 
另 一 个 〈 像 修改 后 的 error) 仅仅 进行 封装 。 这 种 技术 的 唯一 限制 是 verror 这 样 的 函 
数 只 能 对 参数 进行 一 次 扫描 ， 没 有 办 法 再 次 调用 va_start。 
如 果 你 不 能 重 写 底层 函数 〈 如 此 例 中 的 error) 让 它 接受 va_list， 而 必须 把 一 
个 函数 Cfaterror) 接收 到 的 可 变 参 数 作为 实 参 传 给 另 一 个 函数 ， 那 就 没有 什么 可 
移植 的 解决 方案 了 。 “也 许可 以 凭借 机 器 相关 的 汇编 语言 解决 这 个 问题 。 参 见 问 
题 15.13。 ) 


针 。 


数 


~ 


下 面 这 种 方法 肯定 不 行 。 
void faterror (const char *fmt,...) 
{ 
va_list argp; 
va_start(argp, fmt) ; 
error (fmt, argp) ; /* WRONG */ 
va_end (argp) ; 
exit (EXIT_FAILURE) ; 
} 
va_list 本 身 并 不 是 可 变 参 数列 表 ， 它 实际 上 有 几 分 类 似 可 变 参 数列 表 的 指 
也 就 是 说 ， 接 受 va_list 的 函数 本 身 并 不 是 可 变 参 数 函 数 。 
尽管 没什么 可 移植 性 ， 另 一 种 凑合 的 办 法 有 时 也 被 使 用 ， 就 是 用 很 多 的 int 参 
然后 希望 它们 足够 多 而 且 也 能 通过 某 种 方式 传递 指针 、 浮 点 或 其 他 参数 : 
void faterror (fmt, a1, a2, a3, a4, a5, a6) 
char *fmt; 
int al, a2, a3, a4, a5, ad; 
{ 


error (fmt, a1, a2, a3, a4, a5, a6) ; /* VERY WRONG */ 


exit (EXIT_FAILURE) ; 
这 里 引入 这 个 例子 只 是 为 了 让 你 别 用 它 。 


15.13 


问 : 怎样 调用 一 个 在 运行 时 才 构 建 参 数列 表 的 史 数 ? 
答 : 没有 一 个 保证 可 行 或 可 移植 的 方法 。 如 果 你 好 奇 ， 可 以 问 问 本 书 的 作者 


(Steve Summit) ， 他 有 一 些 古 怪 的 点 子 ， 也 许 你 可 以 试 试 .……. 


也 许 你 可 以 试 着 传 一 个 (void *) 数 组 ， 而 不 是 一 个 参数 序列 。 被 调用 函数 就 像 


main 遍 历 argv 那 样 遍历 这 个 数组 。 当 然 这 一 切 都 建立 在 你 能 控制 所 有 的 被 调用 函 
数 之 上 。 参 见 问题 19.41。 


[1.“ 正 确 ” 的 宏 扩展 应 该 是 (*(int (**)0)(((argp)+=sizeof(int (*)())-sizeof(int (*)Q)))- 


B16 Ee Ay PE HN e el 


甚至 都 没 必 要 问 出 这 个 反问 句 : 你 是 否 曾 经 过 到 过 英名 奇妙 的 bug， 无 论 如 
何 就 是 找 不 到 原因 呢 ? 你 当然 遇 到 过 ， 任 何人 都 遇 到 过 。C 语 言 有 很 多 “陷阱 ”， 
随时 准备 捕获 粗心 的 人 们 。 本 章 讨 论 了 部 分 问题 。 (事实 上 ， 任 何 功 能 强大 到 足 
以 流行 的 语言 可 能 都 有 这 样 的 惊人 之 处 。) 


16.1 


问 : 为 什么 这 个 循环 只 执行 了 一 次 ? 

for (i=start; i<end; i++); 

{ 

printf ("%d\n", i); 

} 

答 : 在 for 语 句 的 末尾 意外 加 入 的 分 号 构成 了 一 个 空 语 句 一 一 就 编译 器 而 言 ， 
这 就 是 循环 体 。 接 下 来 的 括号 包含 的 块 ， 你 可 能 觉得 〈 而 缩 进 也 上 暗示 了 ) 是 循环 
体 ， 但 实际 上 不 过 是 下 一 条 语句 ， 无 论 循 环 次 数 是 多 少 ， 这 条 语句 也 只 执行 一 
次 。 

参见 问题 2.19。 

参考 资料 : [22, Sec. 2. 3 pp. 20-21] 


16.2 


问 : 遇 到 不 可 理解 的 不 合理 语法 错误 ， 似 乎 大 段 的 程序 没有 编译 。 

答 : 检查 是 否 有 没 结束 的 注释 、 不 匹配 的 李 f/ 术 fdef/ 扩 fndef/#else/#endif 指 令 或 
者 没 配对 的 引号 。 还 要 记得 检查 头 文件 。 

参见 问题 2.19、10.9 和 11.31。 


16. 


es) 


问 : 为 什么 过 程 调用 不 起 作用 ? 编译 器 似乎 直接 跳 过 去 了 。 

答 : 代码 是 否 看 起 来 像 这 样 ? 

myprocedure; /* my procedure */ 

C 语 言 只 有 函数 ， 而 函数 调用 总 要 用 圆 括号 将 参数 列表 括 起 来 一 即使 没 参 
数 。 应 该 用 这 样 的 代码 : 


myprocedure () ; 


16. 


= 


问 : 程序 在 执行 之 前 就 前 溃 了 ! 〈 用 调试 器 单 步 跟 踪 ， 在 main 函 数 的 第 一 个 
语句 之 前 就 死 了 。) 为 什么 ? 

答 : 也 许 你 定义 了 一 个 或 多 个 非常 大 的 局 部 数组 〈 超 过 上 生字 节 ) 。 许 多 系 
统 的 栈 大 小 是 固定 的 ， 即 使 那些 自动 动态 分 配 栈 的 系统 〈 如 UNIX) 也 会 因为 一 
次 性 要 分 配 大 有 段 栈 而 困惑 。 通 常 最 好 将 大 数组 声明 为 static 当然 ， 除 非 你 需要 在 
每 次 递归 调用 中 使 用 一 组 新 的 变量 。 这 时 可 以 用 malloc 动 态 分 配 。 参 见 问 题 
1.32. ) 

也 可 能 你 的 程序 连接 得 不 对 (连接 了 用 不 同 的 编译 选项 编译 的 目标 模块 或 者 
错误 的 动态 库 ) ， 或 者 因为 某 种 原因 运行 时 动态 库 失 败 了 ， 亦 或 是 因为 你 不 知 怎 
么 就 把 main 给 声明 错 了 。 

参见 问题 11.13、16.5、16.6 和 18.4。 


16.5 


问 : 程序 执行 正确 ， 但 退出 时 在 main 函 数 的 最 后 一 个 语 多 之 后 前 溃 了 。 为 什 
么 会 这 样 ? 

答 : 至 少 有 3 种 情况 需要 检查 : 

如 果 遗 筷 了 前 一 个 声明 的 分 号 ，main 可 能 会 被 意外 地 声明 为 返回 结构 ， 从 而 
跟 运 行 时 启动 代码 的 预期 相 冲 突 。 参 见 问题 2.19 和 10.9。 

如 果 调 用 了 setbuf 和 setvbuf 而 传 给 它们 的 缓冲 区 又 是 main 函 数 的 局 部 (上 自动) 


变量 ， 在 stdio 库 进行 最 后 的 清除 工作 的 时 候 ， 组 冲 区 可 能 已 经 不 存在 了 。 

用 atexit 注 册 的 清除 函数 可 能 有 错 。 也 许 它 试图 访问 main 函 数 的 局 部 数据 或 者 
调用 某 个 已 经 不 存在 的 函数 。 

(第 2 个 和 第 3 个 问题 跟 问题 7.7 紧 密 相 连 。 参 见 问 题 11.18。) 

参考 资料 : [22, Sec. 5. 3 pp. 72-73] 


16.6 


问 : 程序 在 一 台 机 器 上 运行 完美 ， 但 在 另 一 台 上 却 得 到 怪异 的 结果 。 更 奇怪 
的 是 ， 增 加 或 去 除 调试 的 打印 语句 ， 就 改变 了 症状 ……: 

答 : 许多 地 方 有 可 能 出 错 。 下 面 是 一 些 通常 的 检查 要 点 。 

未 初始 化 的 局 部 变量 [1]， 参 见 问题 7.1。 

整数 溢出 ， 特 别 是 在 一 些 16 位 的 机 器 上 ， 在 计算 类 似 a* b / c 这 样 的 表达 式 的 
时 候 ， 一 些 中 间 计 算 结 果 可 能 溢出 ， 参 见 问 题 3.16。 

未 定义 的 求 值 顺序 ， 参 见 问题 3.1 到 3.5。 

忽略 了 外 部 函数 的 说 明 ， 特 别 是 返回 值 不 是 int 的 函数 。 参 见 问题 1.25 和 
14.2% 

解 引 用 的 空 指针 ， 参 见 第 5 章 。 

malloc/free 的 不 适当 使 用 : 认为 malloc 申 请 的 内 存 已 都 被 清 零 、 认 为 已 释放 的 
内 存 还 可 用 、 再 次 释放 已 释放 的 内 存 或 破坏 了 malloc 的 内 部 数据 结构 。 参 见 问 题 
7.23 和 7.24。 

常规 的 指针 问题 ， 参 见 问 题 16.9。 

printf 格 式 与 参数 不 符 ， 特 别 是 用 %d 输 出 long int， 参 见 问 题 12.9。 

试图 分 配 的 内 存 大 小 超出 一 个 unsigned int 类 型 的 范围 ， 特 别 是 在 内 存 有 限 的 
机 器 上 ， 参 见 问 题 7.20 和 19.28。 

数组 溢出 问题 ， 特 别 是 临时 的 小 缓冲 区 ， 例 如 用 于 sprinf 来 构造 一 个 字符 串 。 
参见 问题 7.1 和 12.23。 

错误 地 假设 了 typedef 的 映射 类 型 ， 特 别 是 size_t 参 见 问题 7.19。 

浮 点 问题 ， 参 见 问题 14.1 和 14.4。 

任何 你 自己 认为 聪明 的 特定 机 器 上 的 机 器 代码 生成 小 技巧 。 

正确 使 用 函数 原型 说 明 能 够 捕捉 到 一 些 上 面 的 问题 。lint 会 捕捉 到 更 多 。 人 参见 


问题 16.4、16.5 和 18.4。 


= 
N 


问 : 为 什么 下 面 的 代码 会 前 溃 ? 

char *p="hello,world!"; 

plO]='H'; 

答 : 字符 串 常 量 事实 上 就 是 常量 。 编 译 器 可 能 将 它 放 到 只 读 的 内 存 中 ， 因 此 
修改 它 是 不 安全 的 。 如 果 你 需要 可 写 的 字符 串 ， 必 须 为 它们 分 配 可 写 的 内 存 ， 要 
么 声明 一 个 数组 ， 要 么 调用 malloc。 试 用 : 

char al[]="hello,world!"; 

基于 同样 的 理由 ， 对 老 的 UNIX 例 程 mktemp 的 典型 调用 

char *tmpf i le=mktemp ("/tmp/tmpXXXXXX") ; 

是 不 可 移植 的 。 正 确 的 用 法 是 : 

char tmpfile[]="/tmp/tmpXXXXXX"; 

mktemp (tmpf i le) ; 

参见 问题 1.34。 

参考 资料 : [8, Sec. 6.1.4] 

[11, Sec. 2.7.4 pp. 31-32] 


16.8 


问 : RAL RAR ARM hase, CARMA T, IT “unaligned 
access” (KIIF IDE) 错误 。 这 是 什么 意思 ? 代码 如 下 : 
struct mystruct { 
char c; 
long int i32; 
int 116; 
} s; 
char buf [7], *p; 
fread (buf, 7, 1, fp) ; 


p=buf ; 

s. c=*pt+; 

s. i32=* (long int *)p; 

pt=4; 

s. 116=* (int *)p; 

答 : 问题 在 于 你 对 指针 的 处 理 太 轻率 了 。 有 些 机 器 要 求 在 正确 对 齐 的 地 址 存 
放 数 据 。 例 如 ， 两 个 字 节 的 short int 型 可 能 会 被 放 到 偶 地 址 上 ， 而 4 字 节 的 long int 
型 则 会 被 放 到 4 的 整 倍 数 地 址 上 《参见 问题 2.13) 。 将 char = *《 可 以 指向 任何 字 
W) 转换 成 int * 或 long int * 之 后 再 引用 它 就 可 能 会 导致 要 求 处 理 器 从 未 对 齐 的 地 
址 读 取 多 字 节 的 值 ， 而 这 是 处 理 器 不 允许 的 。 

解析 外 部 结构 更 好 的 方式 是 使 用 这 样 的 代码 : 


struct mystruct {...} s; 


unsigned char *p=buf; 
s. c=*p++; 
i132= (long) *p++< <24; 
i32 |=(long)*p++<<16; 
s. 132 |=(unsigned) (*pt+< <8); 
s. i32 |=*p++; 
s. i 16=*p++< <8; 
. i116 |=*p++; 
这 段 代 码 同 时 也 提供 了 对 字 节 顺序 的 控制 。( 但 这 段 代码 假设 char 型 是 8 位 ， 
而 从 “外 部 结构 ”中 解析 出 的 long int 和 int 型 分 别 是 32 位 和 16 位 。 参 见 问题 12.45〈 那 
里 有 些 类 似 的 代码 ) 的 解释 和 警告 。 
参见 问题 4.5。 
参考 资料 : [35, Sec. 3. 3. 3. 2, Sec. 3.3.4 ] 
[8, Sec. 6. 3.3.2, Sec. 6.3.4 ] 
[11, Sec. 6.1.3 pp. 164-165 ] 


ol 
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(ep) 


16.9 


问 : “Segmentation violation”、“Bus error” 和 “General 


protection fault” 是 什么 意思 ? 

答 : 通常 ， 这 意味 着 你 的 程序 试图 访问 不 该 访问 的 内 存 地 址 ， 一 般 是 由 于 栈 
出 错 或 指针 的 不 正确 使 用 。 可 能 的 原因 有 : 

局 部 数组 〈 栈 上 分 配 的 自动 变量 ) 溢出 ; 

无 意 使 用 到 空 指针 〈 人 参见 问题 5.2 和 5.20) ; 

未 初始 化 指针 、 地 址 未 对 齐 的 指针 或 其 他 没有 适当 分 配 的 指针 《参见 问题 7.1 
和 7.2) ; 

用 过 时 的 别名 访问 已 经 被 重新 分 配 的 内 存 〈 参 见 问 题 7.33) ; 

malloc 的 内 部 结构 被 破坏 (参见 问题 7.23)，; 

试图 修改 只 读 内 存 〈 如 声明 为 const 的 变量 、 字 符 串 字面 量 等 
1.34) ; 

不 匹配 的 函数 参数 ， 尤 其 是 跟 指针 有 关 的 ， 两 种 可 能 是 scanf (参见 问题 
12.13) 和 fprintft 〈 确 保 它 的 第 一 个 参数 是 FILE *) 。 

在 UNIX 下 ， 上 述 的 任何 问题 几乎 都 不 可 避免 地 导致 “core dump”， 在 当前 目 
录 中 会 创建 一 个 名 为 core 的 文件 ， 其 内 容 是 朋 涡 进程 的 内 存 映像 ， 它 可 以 用 于 调 
试 。 

“Bus ”error” 和 “Segmentation ”Violation” 也 许 重要 ， 也 许 不 重要 。 不 同 版 本 的 
UNIX 在 不 同 的 环境 下 会 产生 这 些 信 号 。 简 单 地 讲 ，segmentation ”violation 表 示 企 
图 访问 并 不 存在 的 内 存 ， 而 bus ， error 表示 用 非法 的 方式 访问 内 存 〈 也 许 因为 指针 
未 对 齐 ， 参 见 问题 16.8。 ) 

参见 问题 16.4 和 16.5。 


参见 问题 


[1 至 少 在 基于 栈 的 机 器 上 ， 未 初始 化 局 部 变量 里 的 值 限 栈 上 的 内 容 有 关 ， 也 就 是 
刚 被 调用 的 内 容 。 这 就 是 插入 或 删除 调试 输出 会 导致 bug 消 失 的 原因 : printf 是 个 
大 函数 ， 所 以 是 否 调用 它 会 使 栈 上 的 内 容 大 有 不 同 。 


第 17 章 风格 


计算 机 程序 并 不 仅仅 是 写 来 供 计算 机 处 理 的 ， 它 也 会 用 来 供 其 他 的 程序 员 阅 
读 。 为 了 提高 程序 的 可 读 性 〈 和 可 维护 性 及 减少 程序 的 错误 ) ， 除 了 让 编译 器 接 
受 之 外 ， 还 得 有 些 额 外 的 考量 。 风 格 上 的 考虑 是 计算 机 程序 设计 中 最 不 具有 客观 
性 的 方面 : 关于 代码 风格 的 观点 ， 就 像 门派 之 争 一 样 ， 可 以 无 休 无 止 地 辩论 下 
去 。 恨 好 的 风格 是 个 有 价值 的 目标 ， 这 点 通常 也 被 广泛 认可 。 但 要 严格 规定 它 却 
也 不 能 。 无 论 如 何 ， 缺 乏 良 好 风格 的 客观 标准 乃至 业界 的 共识 并 不 意味 着 程序 员 
就 可 以 放弃 对 程序 可 读 性 的 关注 和 努力 。 


17.1 


问 : 什么 是 C 最 好 的 代码 布局 风格 ? 

答 : Kernighan 和 Ritchie 提 供 了 最 常 被 复 用 的 范例 ， 但 同时 他 们 并 不 要 求 大 家 
沿用 他 们 的 风格 。 

大 括号 的 位 置 并 不 重要 ， 尽 管 人 们 对 此 怀 有 执着 的 热情 。 我 们 在 几 种 流行 的 
风格 中 选 了 一 种 。 选 一 个 适合 你 的 风格 ， 然 后 坚持 使 用 这 一 风格 。 

保持 布局 风格 跟 自 己 、 其 他 人 及 通用 源码 的 一 致 性 比 使 之 “完美 ?更 重要 。 如 
果 你 的 编码 环境 〈 本 地 习惯 或 公司 政策 ) 没有 建议 一 个 风格 ， 而 你 也 不 想 发 明 自 
己 的 风格 ， 当 然 可 以 沿用 K&R 的 风格 。 

几 种 流行 的 风格 各 有 优 缺 点 。 将 左 括号 独立 放 在 一 行 会 浪费 垂直 空间 ， 把 它 
跟 下 一 行 结 合 会 难以 编辑 ， 跟 上 一 行 结合 又 会 导致 它 和 右 括 号 不 能 对 齐 ， 从 而 更 
难看 到 。 

每 级 缩 进 8 列 最 常见 ， 但 常常 又 会 让 你 太 接 近 右 边界 (这 可 能 也 暗示 你 该 分 
解 一 下 你 的 函数 了 ) 而 很 不 和 舒服。 如 果 缩 进 一 个 tab 但 把 tab 值 设 定 为 8 以 外 的 值 ， 
你 就 得 要 求 其 他 人 用 跟 你 一 样 的 软件 设置 来 阅读 你 的 代码 。 参 见 文献 [23]。 

“好 风格 ”的 品质 并 不 简单 ， 它 包含 的 内 容 远 远 不 止 代码 的 布局 细节 。 不 要 把 


时 间 都 花 在 格式 上 而 忽略 了 更 实质 性 的 代码 本 身 的 质量 。 
参见 问题 17.2。 
参考 资料 : [18, Sec. 1.2 p.10] 
[19, Sec. 1. 2 p. 10] 


17.2 


问 : 如 何在 源 文件 中 会 理 分 配 函 数 ? 

答 : 通常 ， 相 关 的 函数 放 在 同一 个 文件 中 。 有 时 候 〈 例 如 开发 库 的 时 候 ) ， 
一 个 源 文件 (自然 也 就 是 一 个 目标 文件 ) 放 一 个 函数 比较 合适 。 有 时 候 ， 尤 其 是 
对 某 些 程序 员 ， 太 多 的 源 文件 可 能 会 很 碎 烦 ， 将 多 数 以 至 所 有 的 程序 都 放 入 少数 
几 个 大 的 源 文 件 中 也 很 诱 人 ， 甚 至 也 是 合适 的 。 希 望 用 static 关 键 字 限制 某 些 函 数 
或 全 局 变量 的 作用 域 时 ， 源 文件 的 分 配 就 有 更 多 限制 了 : 静态 函数 和 变量 以 及 共 
享 它们 的 函数 都 必须 在 同一 个 源 文件 中 。 

换言之 ， 这 里 有 些 权 衡 ， 因 此 很 难 给 出 一 般 的 规则 。 参 见 问题 1.7、1.9、10.6 
和 10.7。 


17.3 


Pl: 用 if(!strcmp (s1, s2)) 比较 两 个 字符 串 是 和 否 相 等 是 个 好 风格 吗 ? 

答 : 这 并 不 是 个 很 好 的 风格 ， 尺 管 这 是 个 流行 的 习惯 用 法 。 如 果 两 个 字符 串 
相等 ， 这 个 测试 返回 真 ， 但 !〈* 非 ?) 的 使 用 容易 引起 误会 ， 以 为 测试 不 相等 情 
况 。 

NTER ~ TA: 

#define Streq(s1,s2) (strcmp ((s1) (s2)) ==0) 

然后 这 样 使 用 : 

if (Streq (s1, s2)) 

男 一 种 选择 (可 以 防止 宏 的 滥用 ， 参 见 问 题 10.2〉 是 定义 

#define StrRel (s1, op, s2) (strcmp (s1, s2) op 0) 

然后 你 可 以 这 样 使 用 : 

if (StrRel (s1, ==, s2))... 


if (StrRel (s1, !=,s2))... 
if (StrRel (s1, >=,s2))... 
参见 问题 17.10。 


17.4 


E: 为 什么 有 的 人 用 if (0==x) 而 不 是 if (x==0) ? 

答 : 这 是 用 来 防止 一 个 常见 错误 的 小 技巧 : 

i f (x=0) 

如 果 你 养 成 了 把 常量 放 在 == 前 面 的 习惯 ， 那 么 当 你 意外 地 把 代码 写成 了 : 

if (0=x) 

编译 器 就 会 报错 。 显 然 ， 一 些 人 会 觉得 记 住 倒转 测试 比 记 住 输 入 两 个 = 号 容 
易 。《〈 的 确 ， 就 算是 经 验 老 道 的 程序 员 有 时 也 会 错 把 == 写 成 =。) 当然 这 个 技巧 
只 对 和 常量 比较 的 情况 有 用 。 

另 一 方面 ， 有 的 人 又 觉得 这 样 倒转 的 测试 既 难 看 又 影响 注意 力 ， 因 而 提出 应 
该 让 编译 器 对 if(x=0) 报 警 。《〈 实 际 上 ， 很 多 编译 器 的 确 对 条 件 式 中 的 赋值 报警 ， 
当然 如 果 你 真 的 需要 ， 你 总 是 可 以 写 if((x=expression)) 或 if((x=expression)!=0)。 

参考 资料 : [11, Sec. 7.6.5 pp. 209-210] 


17.5 


问 : 为 什么 有 些 代码 在 每 次 调用 printf 前 增加 了 类 型 转换 (void) ? 

答 : printf 确 实 有 返回 值 〈 输 出 的 字符 个 数 或 错误 码 ) ， 但 几乎 没有 谁 会 去 检 
验 每 次 调用 的 返回 值 。 由 于 有 些 编译 器 和 1lint 对 于 被 丢弃 的 返回 值 会 报警 告 ， 显 式 
地 用 (void) 作 类 型 转换 相当 于 说 :“ 我 决定 忽略 这 次 调用 的 返回 值 ， 请 继续 对 于 其 
他 (也 许 不 慎 ) 忽略 返回 值 的 情况 提出 警告 >。 通 常 ，(void) 类 型 转换 也 用 于 strcpy 
和 strcat 的 调用 ， 它 们 的 返回 值 从 没有 什么 惊人 之 处 。 

参考 资料 : [19, Sec. A6.7 p.199] 

[14, Sec. 3. 3. 4] 
[11, Sec. 6.2.9 p. 172, Sec. 7.13 pp. 229-230] 


p= 
N 
(=p) 


问 : 既然 NULL 和 0 都 是 空 指针 常量 ， 我 到 底 该 用 哪 一 个 ? 
答 : 参见 问题 5.9。 


ps 


FA 


N 


问 : 是 该 用 TRUE 和 FALSE 这 样 的 符号 名 称 还 是 直接 用 1 和 0 来 作 布尔 常量 ? 
答 : 参见 问题 9.4。 


p 
N 
co 


H: 什么 是 “匈牙利 表示 法 ” (Hungarian Notation) ? 是 否 值 得 一 试 ? 

答 : 匈牙利 表示 法 是 一 种 命名 约定 ， 由 Charles Simonyi 发 明 。 他 把 变量 的 类 
型 〈 或 者 它 的 预期 使 用 ) 等 信息 编码 在 变量 名 中 。 在 某 些 圈子 里 ， 它 被 极度 热 
爱 ， 而 在 男 一 些 地 方 ， 它 又 受到 严厉 的 批评 。 它 的 主要 优势 在 于 变量 名 就 说 明了 
它 的 类 型 或 者 用 法 。 它 的 主要 缺点 在 于 类 型 信息 并 不 值得 放 在 变量 名 中 。 

参考 资料 : [32] 


ps 


7.9 


H: 哪里 可 以 找到 “lndian Hill Style Guide” 及 其 他 编码 标准 ? 
答 : 各 种 文档 在 匿名 ftp 都 可 以 得 到 : 


地 址 文档 及 目录 
ftp.cs.washington.edu pub/estyle.tar.Z 
(更 新 的 Indian Hill Guide ) 
ftp.cs.toronto.edu doc/programming 
(包括 Henry Spencer) (CFF afi) © “10 Commandments for C 
Programmers” ) ) 
ftp.cs.umd.edu pub/style-guide 


也 许 你 会 对 这 些 书 感 兴趣 : The Elements of Programming Style[17]. Plum Hall 
Prog-ramming Guidelines[28] 和 C Style: Standards and Guidelines[33]. 


参见 问题 18.8。 
17.10 


问 : 有 人 说 goto 是 莉 恶 的， 永远 部 不 该 用 它 。 这 是 否 太 极端 了 ? 

答 : 程序 设计 风格 就 像 写 作风 格 一 样 ， 是 某 种 程度 的 艺术 ， 不 能 被 僵化 的 教 
条 所 束缚 。 虽 然 风格 的 探讨 经 常 都 是 围绕 着 这 些 规 则 。 

对 于 goto 语 句 ， 很 早 以 前 人 们 就 注意 到 随意 地 使 用 goto 会 很 快 地 导致 难以 维 
护 的 混乱 代码 (spaghetti code) 。 然 而 ， 不 经 思考 束 人 简单 地 禁止 goto 的 使 用 并 不 
能 立即 得 到 优美 的 程序 。 一 个 无 规划 的 程序 员 也 许 使 用 奇怪 的 骸 套 循环 和 布尔 变 
量 来 取代 goto， 一样 能 构造 出 复杂 难 懂 的 代码 。 

通常 ， 把 这 些 程序 设计 风格 的 评论 或 者 “规则 ”( 结 构 化 编程 好 、goto 不 好 、 
函数 应 该 在 一 页 以 内 等 ) 当 作 指导 准则 比 当 作 规则 要 更 好 。 如 果 程 序 员 理解 这 些 
指导 准则 所 要 实现 的 目标 ， 其 效果 就 会 更 好 。 盲 目地 回避 某 种 构造 或 者 死 套 规 则 
而 不 融会 贯通 ， 最 终 还 会 导致 这 些 规则 试图 避免 的 问题 。 

此 外 ， 许 多 程序 设计 风格 的 观点 只 是 “观点 ”而 已 。 某 些 观点 看 似 经 过 了 充分 
的 讨论 、 得 到 了 强烈 的 支持 ， 但 跟 它 相 对 的 观点 可 能 也 得 到 了 同样 多 的 支持 。 通 
常 卷 入 “风格 战争 ”是 之 无 意义 的 。 对 于 某 些 问题 〈 像 问题 5.3、5.9、9.2 和 10.7) F 
辩 的 双方 是 不 可 能 同意 、 认 同 对 方 的 不 同 或 者 是 停止 争论 的 。 

最 后 ， 正 如 William Strunk 所 写 的 〈 引 上 自 Strunk 和 White 的 经 典 彰 作 Elements of 
Styles 的 序 ) : 

人 们 早 就 发 现 最 好 的 作家 有 时 候 对 花言巧语 的 规则 置 之 不 顾 。 然 而 ， 当 他 们 
不 守 规 则 的 时 候 ， 读 者 往往 会 在 字里行间 发 现 以 违规 为 代价 得 到 补偿 价值 。 除 非 
他 确信 能 做 好 ， 否 则 最 好 还 是 遵守 规矩 。 

参考 资料 : [7] 

[20] 


17.11 


问 : 人 们 总 是 说 良好 的 风格 很 重要 ， 但 当 他 们 使 用 良好 的 风格 写 出 清晰 易 读 
的 程序 后 ， 又 发 现 程序 的 效率 似乎 降低 了 。 既 然 效 率 那 么 重要 ， 是 否 可 以 为 了 效 


率 御 牲 一 些 风格 和 可 读 性 呢 ? 

答 : 的 确 ， 效 率 低下 的 程序 是 个 问题 ， 但 很 多 程序 员 有 时 对 效率 的 盲目 追求 
也 是 个 问题 。 麻 烦 星 涩 的 编程 技巧 不 仅 降低 可 读 性 和 可 维护 性 ， 同 时 跟 选 择 合适 
的 设计 或 算法 相 比 ， 也 可 能 导致 更 微不足道 的 长 期 效率 提升 。 小 心 对 待 ， 设 计 出 
既 清晰 又 高 效 的 代码 也 是 可 能 的 。 

参见 问题 20.14。 


第 18 章 工具 和 资源 


坐 在 沙发 上 可 写 不 出 什么 实际 的 程序 来 ， 显 然 你 需要 一 个 编译 器 ， 有 些 其 他 
工具 也 会 很 方便 。 本 章 讨论 了 一 些 工 具 ， 重 点 是 lint， 同 时 也 介绍 了 其 他 一 些 资 
源 。 这 里 提 到 的 茶 些 工具 和 资源 可 以 在 因特网 上 找到 。 但 请 注意 ， 网 站 名 称 和 文 
件 位 置 可 能 会 改变 。 这 里 给 出 的 地 址 虽然 在 写 书 的 时 候 都 经过 了 验证 ， 但 当 你 看 
到 的 时 候 也 许 已 经 变 了 。 


PA 
AG 


I R 
C 交 叉 引 用 生成 器 
C 源 代码 美化 器 /美化 打印 
版 本 控制 和 管理 工具 
C 源 代码 扰乱 器 〈 遮 蔽 器 ) 
“make ”依赖 关系 生成 器 
源 代码 度 规 计算 工具 
C 源 代码 行 数 计数 器 
C 声 明 帮 助 (cdecl) 
原型 生成 器 
malloc 问 题 捕获 工具 
“选择 性 ”的 C 预 处 理 器 
语言 翻译 工具 
C 验 证 工具 (lint) 
C 编 译 器 


_ 
or 
jà 


否 列 一 个 常用 工具 列表 ? 
答 : 这 是 一 个 常用 工具 的 列表 。 


程序 名 (参见 问题 18.20) 
cflow、 cxref、 calls. cscope、 xscope、ixfw 
cb, indent, GNU indent, vgrind 
CVS. RCS. SCCS 
obfus, shroud, opqep 
makedepend， 或 者 尝试 cc-M 或 cpp-M 
ccount、Metre、lcount、csize 或 McCable and Associates 出 售 的 商业 包 
可 以 用 UNIX 的 标准 工具 wc 作 个 大 概 的 计算 ， 但 用 grep -c "; "要 好 得 多 。 
见 comp.sources.unix 第 14 卷 (参见 问题 18.20) 和 文献 [19] 
参见 问题 11.33 
参见 问题 18.2 
参见 问题 10.18 
参见 问题 11.33 和 20.32 
参见 问题 18.6 


参见 问题 18.3 


这 个 工具 列表 并 不 完全 ， 如 果 你 知道 有 没 列 出 的 工具 ， 欢 迎 联 系 作 者 。 
其 他 工具 列表 和 关于 它们 的 讨论 可 以 在 新 闻 组 comp.compilers 和 


comp.software-eng 找 到 。 


参见 问题 18.3 和 18.20。 
18.2 


问 : 怎样 捕获 棘手 的 malloc 问 题 ? 

答 : 有 好 几 个 调试 工具 包 可 以 用 来 捕获 malloc 问 题 。 其 中 一 个 流行 的 工具 是 
Conor P.Cahill 的 “dbmalloc”， 人 发 表 在 comp.sources.misc1992 年 第 32 卷 。 还 
有 “leak”， 公 布 在 comp.sources.unix 档 案 第 27 卷 , “Snippets”" 收 集中 的 JMalloc.c、 
JMalloch、MEMDEBUG (ftp://ftp.crpht.lu/pub/sources/memdebug) 和 Electric 
Fence。 参 见 问题 18.20。 

还 有 一 些 商 业 调试 工具 ， 对 调试 malloc 等 坏 手 问题 相当 有 用 : 

CodeCenter (Saber-C) , Centerline Software (http://www.centerline.com/) 出 


z0 


Insight (now Insure?) , ParaSoft Corporation (http://www.parasoft.com/) 出 
TE 

Purify, Rational Software (http://www-306.ibm.com/software/rational/, JAX xe 
Pure Software， 现 在 是 IBM 的 一 部 分 ) 出 品 ; 


ZeroFault, The ZeroFault Group (http://www.zerofault.com/) 出 品 。 


18.3 


问 : 有 什么 免费 或 便宜 的 编译 器 可 以 使 用 ? 

答 : 自由 软件 基金 的 GNU C (gcc,http://gcc.gnu.org/) 是 个 流行 而 高 质量 的 免 
费 C 编 译 器 。djgpp _‘Chttp://www.delorie.com/djgpp/) 是 移植 到 MS-DOS 的 GCC 版 
本 。 据 我 所 知 ， 也 有 移植 到 Mac 和 Windwos 上 的 GCC 版 本 。[1] 

lcc 是 另外 一 个 流行 的 编译 器 Chttp://www.cs.virginia.edu/~ Icc-win32/Ail 
http://www.cs.princeton.edu/software/lcc/) o 

Power C 是 Mix Sotfware 公 司 提供 的 一 个 非常 便宜 的 MS-DOS 下 的 编译 器 。 公 
司 地 址 : 1132 Commerce Drive,Richardson,TX 75801,USA,214-783-6001。 

ftp://ftp.hitech.com.au/hitech/pacific 是 个 MS-DOS 下 的 试用 C 编 译 器 。 非 商业 用 
途 的 不 一 定 要 注册 。 


新 闻 组 comp.compilers 的 档案 中 有 许多 有 关 各 种 语言 的 编译 器 、 解 释 器 、 语 法 
规则 的 信息 。 新 闻 组 在 http://compilers.iecc.com/ 的 档案 包含 了 一 个 FAQ 列 表 和 免费 
编译 器 的 目录 。 

参见 问题 18.20。 


In 


— 
= 


C 语 言 是 伴随 着 UNIX 操 作 系 统 而 开发 的 ， 因 此 它 也 遵循 “每 个 工具 应 该 只 完 
成 一 个 任务 ， 而 且 要 完成 得 很 好 ”的 理念 。 传 统 上 ，C 编 译 器 的 任务 是 从 源码 生成 
机 器 代码 ， 而 不 是 向 程序 员 警 告 所 有 可 能 的 错误 或 失策 的 技术 。 这 个 任务 留 给 了 
另 一 个 独立 的 工具 ， 名 为 lint。 尽 管 随 着 岁月 的 流逝 ，lint 的 重要 性 已 经 降低 了 ， 
但 是 新 的 编译 器 仍然 未 必 能 完全 取代 它 的 诊断 能 力 ， 因 此 在 明智 程序 员 的 武器 库 
中 可 能 还 有 它 的 一 席 之 地 。 


18.4 


问 : 刚刚 输入 完 一 个 程序 ， 但 它 表现 得 很 奇怪 。 你 能 发 现 有 什么 错误 的 地 方 
吗 ? 

答 : 先 看 看 你 是 否 能 用 lint 跑 一 遍 ( 用 -a、-c、-h、-p 或 别 的 参数 [21) 。 许 多 C 
编译 器 实际 上 只 是 半 个 编译 器 ， 它 们 选择 不 去 诊断 许多 源 程 序 中 不 会 妨碍 代码 生 
成 的 难点 。〔 但 是 也 应 该 检查 一 下 你 的 编译 器 是 否 还 有 可 选 的 额外 的 警告 级 
别 。) 

参见 问题 16.6、16.9 和 18.6。 

参考 资料 : [6] 


18. 


(ez) 


问 : ”如 何 关 掉 |int 对 每 个 mal1loc 调 用 报 出 的 “warning:possible pointer 
alignment problem” 7.2%? 

答 : 问题 在 于 传统 的 lint 版 本 无 从 得 知 malloc“ 返 回 指向 正确 对 齐 的 、 可 用 于 
存储 任何 类 型 的 空间 的 指针 ”。 可 以 用 #define 在 ##fdef lint 内 定义 一 个 假 的 malloc 来 
把 这 个 警告 关 掉 。 

但 是 未 经 周密 考虑 的 实现 也 会 关 掉 对 真正 错误 调用 的 有 意义 的 警告 消息 。 更 


简单 的 方法 可 能 就 是 直接 忽略 这 条 消息 ， 可 以 用 grep-v 上 自动 滤 掉 。《 但 是 别 养 成 
忽略 太 多 lint 和 警告 的 习惯 否则， 有 一 天 你 会 错过 真正 重要 的 消息 。) 


18.6 


H: 哪里 可 以 找到 兼容 ANS1 的 |int? 
答 : PC-Lint 和 FlexeLint 是 Gimpel Software 公 司 的 产品 
Chttp://www.gimpel.com/) 。 

UNIX System V 版 本 4 的 lint 兼 容 ANSI。 可 以 从 UNIX Support Labs 或 System V 
的 销售 商 单独 得 到 〈 和 其 他 C 工 具 捆 绑 在 一 起 ) 。 

在 ftp.skimo.com 的 ws/scs/ansilint/ 目 录 下 可 以 找到 一 个 符合 ANSI 标 准 的 、 可 再 
发 布 的 lint。 

另外 一 个 兼容 ANSI 的 lint 是 Splint 〈 以 前 叫 lclint，http:/www.splint.org/) > ‘© 
可 以 作 一 些 高 级 别 的 正式 检验 。 

如 果 没 有 lint， 许 多 现代 的 编译 器 可 以 作出 几乎 和 lint 一 样 多 的 诊断 。 许 多 网 
友 推 荐 gcc -Wall -pedantic. 


18.7 


问 : 难道 ANS1 函 数 原型 说 明 没有 使 1int 过 时 吗 ? 

答 : 其 实 不 是 。 首 先 ， 原 型 说 明 只 有 在 它们 存在 和 正确 的 情况 下 才 工 作 。 一 
个 无 心 的 错误 原型 说 明 比 没有 更 糟 。 其 次 ，lint 会 检查 多 个 源 程序 文档 的 一 致 性 ， 
以 及 数据 和 函数 的 说 明 。 最 后 ， 像 lint 这 样 独立 的 程序 在 加 强 兼 容 的 、 可 移植 的 代 
码 惯例 上 会 比 任 何 特定 的 、 特 殊 实现 的 、 充 满 特 性 和 扩展 功能 的 编译 器 更 加 说 
H. 


FN 


如 果 你 确实 要 用 函数 原型 说 明 而 不 是 lint 来 作 多 文件 一 致 性 检查 ， 务 必 保 证 原 
型 说 明 在 头 文件 中 的 正确 性 。 参 见 问题 1.7 和 10.6。 


资 ; 


再 次 提醒 ， 因 特 网 总 是 处 于 不 断 变 化 之 中 ， 因 此 本 市 中 列举 的 部 分 网 络 地 址 
在 你 读 到 这 里 的 时 候 可 能 已 经 改变 了 。 


18.8 


问 : 网 上 有 哪些 C 语 言 的 教程 或 其 他 资源 ? 

答 : 在 http://cprog.tomsweb.net 有 个 Tom Torfs 写 的 教程 还 不 错 。 

Christopher Sawtell 写 的 “Notes for C programmers”。 在 下 面 的 地 址 可 以 找到 : 
ftp://svr-ftp.eng.cam.ac.uk/misc/sawtell_C.shar、 ftp://garbo.uwasa.fi/pc/c-lang/c- 
lesson.zip. http://www.fi.uib.no/Fysisk/Teori/KURS/OTHER/newzealand.html. 

Time Love 的 “C for Programmers”. http://www- 
h.eng.cam.ac.uk/help/tplI/languages/C/teaching_C/ 

“Coronado Enterprises”C 教 程 在 Simtel 镜 像 点 目录 pub/msdos/c 或 在 
http://www.coronadoenterprises.com/tutorials/c/index.html FJ VA $R FI] 

Steve Holmes 的 在 线 教程 http://www.strath.ac.uk/IT/Docs/Ccourse/。 

Martin Brown 的 网 页 有 一 些 C 教 程 的 资料 http://www- 
isis.ecs.soton.ac.uk/computing/c/Welcome.html. 

在 一 些 UNIX 的 机 器 上 ， 在 shell 命 令 行 下 可 以 试 试 qearn c”。 注 意 ， 这 个 教程 
可 能 比较 旧 了 。 

最 后 ， 本 书 的 作者 以 前 教授 过 一 些 C 的 课程 ， 这 些 笔记 都 放 在 了 网 上 
http://www.eskimo.com/~ scs/cclass/cclass.html . 

【不 承诺 申明 : 我 没有 审阅 过 我 收集 的 这 些 教程 ， 它 们 可 能 含有 错误 。 除 了 
那个 有 我 名 字 的 教程 以 外 ， 我 不 能 为 其 他 教程 提供 保证 。 而 且 这 些 信息 会 很 快 过 
时 。 也 许 ， 当 你 读 到 这 本 书 ， 有 些 地 址 已 经 不 能 用 了 。】 

这 其 中 的 几 个 教程 ， 再 加 上 许多 其 他 C 的 信息 ， 可 以 从 


http://www.lysator.liu.se/c/index.html 得 到 。 


Vinit Carpenter 维 护 着 一 个 学 习 C 和 C++ 的 资源 列表 ， 公 布 在 新 闻 组 
comp.lang.c 和 comp.lang.c+t+， 也 归档 在 本 FAQ 的 所 在 《参见 问题 20.47) ， 或 者 
http://www.cyberdiem.com/Vin/learn.html. 

参见 问题 18.9、18.10 和 18.18。 


18.9 


问 : 哪里 可 以 找到 好 的 源 代码 实例 ， 以 供 研究 和 学 习 ? 

答 : 这 里 有 几 个 链接 可 以 参考 :; ftp://garbo.uwasa.fi/pc/c-lang/00index.txt、 
http://www.eskimo.com/~scs/src/. 

小 心 ， 网 上 也 有 数 之 不 尽 的 非常 糟糕 的 代码 。 不 要 从 坏 代 码 中 “学 习 ”。 这 是 
每 个 人 都 可 以 做 到 的 ， 你 可 以 做 的 更 好 。 参 见 问题 18.8、18.13、18.18 和 18.20。 


18.10 


问 : 有 什么 好 的 学 习 C 语 言 的 书 ? 有 哪些 高 级 的 书 和 参考 ? 

ES: 有 无 数 有 关 C 语 言 的 书 ， 我 们 无 法 一 一 列 出 ， 也 无 法 评估 所 有 的 书 。 许 
多 人 相信 最 好 的 书 ， 也 是 第 一 本 : 由 Kernighan 和 Richie 编 写 的 The C programming 
Language (“K&R”， 现 在 是 第 二 版 了 [19]) 。 对 这 本 书 是 否 适 合 初学 者 有 不 同 的 
意见 。 我 们 当中 许多 人 是 从 这 本 书 学 的 C 语 言 ， 而 且 学 得 还 不 错 。 然 而 有 些 人 觉 
得 这 本 书 太 客观 了 些 ， 不 大 适合 那些 没有 太 多 程序 设计 经 验 的 人 作为 第 一 个 教 
程 。 网 上 有 一 些 评注 和 勘误 表 ， 例 如 : http:/Awww.csd.uwo.ca/~ 
jamie/.Refs/.Footnotes/C-annotes.html、 http:/www.eskimo.com/~ 
scs/cclass/cclass.html 和 http://cm.bell-labs.com/cm/cs/cbook/2ediffs.html。 

许多 活跃 在 新 闻 组 comp.lang.c 的 人 推荐 K.N.King 写 的 C:A Modern 
Approach. [3] 

一 本 极 好 的 参考 书 是 由 Samuel P.Harbison#llGuy L.Steele 和 写 的 C:A Reference 
Manual[11]. 

C 和 C++ 用 户 协会 (Association of C and C++, ACCU) 维护 着 一 份 很 全 面 的 
有 关 C/C++ 的 书目 评论 (http:/www.accu.org/bookreviews/public/) 。 

参见 问题 18.8。 


18.11 


: 哪里 能 找到 K&R 的 练习 答案 ? 
: 在 The C Answer Book 中 。 参 见 文献 [24]。 


1) SY 


18.12 


=]: 哪里 能 找到 Numerical Recipes in C、Plauger 的 The Standard C 
Library[4] &Kernighan#ePikef&JThe UNIX Programming Enviroment 等 书 里 的 源 
码 ? 

答 : 如 问题 中 提 到 的 那些 包含 大 量 可 能 有 用 的 源码 的 书 ， 往 往 都 会 明确 指出 
源码 如 何 取得 或 者 使 用 源码 的 条 件 。 出 版 的 源码 是 有 版 权 的 ， 未 经 许可 通常 都 不 
能 使 用 ， 尤 其 是 不 能 再 传播 《但 如 果 你 自己 输入 电脑 且 用 于 个 人 目的 ， 出 版 商 一 
般 并 不 在 意 ) 。 通 常 可 以 从 出 版 商 获取 磁 盘 〈 或 光盘 ) 。 另 外 ， 很 多 出 版 商 也 设 
并 了 ftp 网 站 和 Web 网 页 。 

Numerical Recipes 中 的 有 些 例 程 已 经 释放 到 公共 领域 了， 查看 一 下 ftp.std.com 
的 vendors/Numerical-Recipes/Public-Domain/ 目 录 。 

本 书 中 的 源码 虽然 也 有 版 权 ， 但 已 经 明确 可 以 让 你 在 自己 的 程序 中 任意 使 
用 。《 自 然 ， 如 果 你 指出 来 源 于 本 书 ， 作 者 和 出 版 者 将 不 胜 感激 。) 大 段 的 代码 
和 相关 的 材料 可 以 在 aw.com 的 cseng/authors/summit/cfaq/ 下 找到 。 


18.13 


问 : 哪里 可 以 找到 标准 0 也 数 库 的 源 代码 ? 

E: GNU 工 程 有 一 个 完全 实现 的 C 函 数 库 
(http://www.gnu.org/software/libc/〉。 男 一 个 来 源 是 由 P.J.Plauger 写 的 书 The 
Standard C Library[27]， 然 而 它 不 是 公共 领域 的 。 

参见 问题 18.7、18.18 和 18.20。 


H: 是 否 有 一 个 在 线 的 C 参 考 指南 ? 
答 : 提供 两 个 选择 : http://www.cs.man.ac.uk/standard_c/_index.html 和 
http://www.dinkumware.com/htm_cl/index.html. 


18.15 


问 : 我 需要 分 析 和 评估 表达 式 的 代码 。 从 哪里 可 以 找到 ? 

E: 有 两 个 软件 包 可 用 : “defunc”"， 于 1993 年 12 月 公布 在 新 闻 组 
comp.sources.misc(V41 i32，33)，1994 年 1 月 公布 于 新 闻 组 alt.sources。 可 以 在 这 个 
URL 得 到 : ftp://sunsite.unc.edu/pub/packages/development/libraries/defunc- 
1.3.tar.Z;“parse”， 可 以 从 lamont.ldgo.columbia.edu 得 到 。 其 他 选择 包括 S-Lang 注 释 
器 (Chttp:/www.s-lang.org/) ， 共 享 软件 Cmm (“Cia UF fit PA ERB PAC”) o 
参见 问题 18.20 和 20.6。 

Software Solutions in C[30] 中 也 有 一 些 分 析 和 评估 的 代码 〈 第 12 章 ，235 一 255 
页 ) 。 


18.16 


问 : 哪里 可 以 找到 C 的 BNF 或 YACC 语 法 ? 

答 : ANSI 标 准 中 的 语法 是 最 权威 的 。 由 Jim Roskind 写 的 一 个 语法 在 
ftp://ftp.eskimo.com/ws/scs/roskind_grammar.Z。 一 个 Jeff ”Lee 做 的 、 新 鲜 出 炉 的 
ANSI C90 语 法 工作 实例 可 以 在 ftp://ftp.uu.net/usenet/net.sources/ansi.c.grammar.Z 得 
到 ， 还 包含 了 一 个 相配 的 lexer。FSF 的 GNU CC 编译 器 也 含有 一 个 语法 ， 当 然 还 有 
K&R 的 附录 也 有 一 个 。 

新 闻 组 comp.compilers 的 档案 中 含有 更 多 的 有 关 语 法 的 信息 ， 参 见 问题 18.3。 

参考 资料 : [18, Sec. A18 pp. 214-219] 

[19, Sec. A13 pp. 234-239] 
[35, Sec. A. 2] 

[8, Sec. B. 2] 

[11, pp. 423-435 Appendix B] 


问 : 谁 有 0 编译 器 的 测试 套件 ? 

Z: Plum Hall (以 前 在 Cardiff，NJ， 现 在 在 Hawaii〉》 有 一 个 套件 出 售 ， 
Ronald Guilmette 的 RoadTest1M 编 译 器 测试 套件 (更 多 信息 在 
ftp://netcom.com/pub/rfg/roadtest/announce.txt) 和 Nullstone 的 自动 编译 器 性 能 分 析 
工具 Chttp://www.nullstone.com) 。FSF 的 GNU C (gcc) 发 布 中 含有 一 个 检查 许多 
编译 器 共同 问题 的 C 严 酷 测 试 。Kahan 的 偏执 狂 的 测试 

(ftp://netlib.att.com/netlib/paranoia)， 尽 其 所 能 地 测试 C 实 现 的 浮 点 能 力 。 


18.18 


问 : 哪里 有 一 些 有 用 的 源 代码 片段 和 例子 的 收集 ? 

答 : Bob Stout 的 “SNIPPETS” 是 个 很 流行 的 收集 
(ftp://ftp.brokersys.com/pub/snippets 或 http://www.brokersys.com/snippets/) 。 

Lars Wirzenius 的 “publib” 函 数 库 (ftp://ftp.funet.fi/pub/languages/C/Publib/) 。 

参考 问题 14.12、18.8、18.9、18.13 和 18.20。 


18.19 


问 : 我 需要 执行 多 精度 算术 的 代码 。 

答 : 一 些 流行 的 软件 包 是 :“guad”， 函 数 在 Net BSD UNIX Hibe 
(ftp.uu.net,/systems/unix/bsd-sources/.../src/lib/libc/quad/* ) ; GNU MP ek 2 
库 “"libmp”，MIRACL 软 件 包 Chttp://indigo.ie/~mscott/) ; David Bell 和 Landon 
Curt Noll 写 的 “calc”* 程 序 ， 以 及 老 UNIX 的 libmp.a。 参 见 问题 14.12 和 18.20。 

参考 资料 : [30, Sec. 17 pp. 343-454] 


18.20 


问 : 在 哪里 和 怎样 取得 这 些 可 自由 发 布 的 程序 ? 
答 : 随 着 可 利用 程序 数目 ， 公 共 可 访问 的 存档 网 站 数目 以 及 访问 的 人 数 的 增 


加 ， 这 个 问题 回答 起 来 变 得 既 容易 又 困难 。 

有 几 个 比较 大 的 公共 存档 网 站 ， 例 如 : ftp.uu.net, archive.umich.edu, 
oak.oakland.edu，sumex-aim.stanford.edu 和 wuarchive.wustledu。 它 们 免费 提供 极 
多 的 软件 和 信息 。FSF GNU 工 程 的 中 心 发 布地 址 是 ftp.gnu.org。 这 些 知 名 的 网 站 
往往 非常 繁忙 而 难以 访问 ， 但 也 有 不 少 “ 镜 像 * 网 站 来 分 担负 载 。 

在 互联 网 上 ， 传 统 取得 档案 文件 的 方法 是 通过 匿名 ftp。 对 于 不 能 使 用 ftp 的 
人 ， 有 有 几 个 ftp-by-mail 的 服务 器 可 供 使 用 。 越 来 越 多 的 ， 万 维 网 WWW) 被 使 用 
在 文件 的 宣告 、 索 引 和 传输 上 。 也 许 还 会 有 新 的 访问 方法 。 

这 些 是 问题 中 比较 容易 回答 的 部 分 。 困 难 的 部 分 在 于 详情 一 一 本 文 不 能 追踪 
或 列表 所 有 的 文档 网 站 或 各 种 访问 的 方法 。 如 果 你 已 经 可 以 访问 互联 网 了 ， 你 可 
以 取得 比 本 文 更 加 及 时 的 活跃 网 站 信息 和 访问 方法 。 

问题 的 男 一 个 即 难 也 易 的 方面 是 找到 哪个 网 站 有 你 所 要 的 。 在 这 方面 有 极 多 
的 研究 ， 几 乎 每 天 都 有 可 能 有 新 的 索引 服务 出 台 。 其 中 最 早 的 服务 之 一 
是 “archie”， 当 然 还 有 许多 高 曝光 的 商业 网 络 索 引 和 搜索 服务 ， 例 如 Alta Vista, 
Excite 和 Yahoo。 

如 果 你 可 以 访问 Usenet， 请 得 看 定期 发 布 在 新 闻 组 comp.sources.unix 和 
comp.sources.misc 的 邮件 ， 其 中 有 说 明 新 闻 组 归档 的 政策 和 怎样 访问 档案 。 其 中 
两 个 是 : ftp://gatekeeper.dec.com/pub/usenet/comp.sources.unix/， 
ftp://ftp.uu.net/usenet/comp.sources.unix/。 新 闻 组 comp.archives 包 括 了 多 数 的 有 关 各 
种 东西 的 匿名 ftp 网 站 公告 。 最后， 通常 新 闻 组 comp.sources.wanted 是 个 适合 询问 
源 代 码 的 地 方 ， 不 过 在 发 贴 前 ， 请 先 查 看 它 的 FAQ“ 怎 样 查 找 资 源 (How to find 
sources) ”。 

参见 问题 14.12、18.9、18.13 和 18.18。 


[Windows 下 有 两 个 可 移植 版 本 cygwin Chttp://www.cygwin.com/) 和 
MinGW http://http://www.mingw.org/) 。 一 一 译 者 注 


[1 在 茶 些 版 本 的 lint 下 ， 这 些 选 项 会 进行 额外 的 检查 ， 而 某 些 其 他 版 本 下 则 不 
Zo 


ee 《C 语 言 程序 设计 : 现代 方法 》 已 经 由 人 民 邮 电 出 版 社 出 版 。 一 一 
编者 注 
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第 19 章 系统 依赖 


C 是 一 个 编程 语言 而 不 是 一 个 操作 系统 。 没 有 哪 种 编程 语言 会 详细 规定 程序 
和 它 的 环境 之 间 的 所 有 可 能 的 交互 ， 但 对 执行 特定 系统 相关 任务 的 程序 员 来 说 ， 
针对 他 所 使 用 的 语言 提出 相关 的 问题 却 是 十 分 自然 的 。 现 实 中 的 程序 经 常 需要 执 
行 一 次 一 字符 输入 、 光 标 控制 的 全 屏 输 出 、 窗 口 管理 的 交互 (包括 沫 单 和 对 话 
框 )》 、 鼠 标 输入 、 图 形 、 窗 口 通 信 、 打 印 支 持 、 与 各 种 外 设 交 互 、 联 网 等 任务 。 
C 语 言 的 定义 对 这 些 却 只 字 未 提 。 

完成 这 些 任务 的 特定 技术 在 当今 流行 的 机 器 和 操作 系统 之 间 差 别 其 大 ， 因 此 
不 能 提供 每 种 组 合 的 完整 答案 。 本 章 的 问题 都 是 你 不 能 用 可 移植 C 程 序 完成 的 事 
情 : 多 数 答案 都 会 归结 为 "这 是 系统 相关 的 ?。 《如 果 本 章 提 供 简短 答案 不 够 ， 你 
可 能 需要 找 找 你 使 用 的 特定 系统 的 详细 文档 。 ) 

本 章 的 系统 相关 问题 分 为 几 类 : 


键盘 和 屏幕 IO 19.1~19.5 
其 他 IO 19.6 一 19.10 
文件 和 目录 19.12~19.26 
访问 原始 内 存 19.27~19.31 
“系统 ”命令 19.32~19.35 
进程 环境 19.36~19.41 


其 他 系统 相关 的 操作 “19.42 一 19.45 
回顾 19.48~19.49 


Be tit All HEIO 


19.1 


问 : 怎样 从 键盘 直接 读 入 字符 而 不 用 等 回 车 键 ? 怎样 防止 字符 输入 时 的 回 


显 ? 


答 : 唤 ， 在 C 里 没有 一 个 标准 且 可 移植 的 方法 。 在 标准 中 跟 本 就 没有 提 及 屏 
幕 和 键盘 的 概念 ， 只 有 基于 字符 <“ 流 ” 的 简单 输入 输出 。 

在 某 个 级 别 ， 与 键盘 的 交互 输入 一 般 都 是 由 系统 取得 一 行 的 输入 才 提 供给 需 
要 的 程序 。 这 让 操作 系统 可 以 用 一 种 统一 的 方式 进行 行 编辑 ( 退 格 、 删 除 、 擦 除 
等 ) ， 而 不 用 每 一 个 程序 自己 搞 一 套 。 当 用 户 对 输入 满意 并 键入 回 车 键 《〈 或 等 价 
的 键 ) 后 ， 输 入 行 才 被 提供 给 需要 的 程序 。 即 使 程序 中 用 了 读 入 单个 字符 的 函数 
《如 getchar 等 ) ， 第 一 次 调用 也 会 等 到 完成 了 一 整 行 的 输入 才 返 回 。 这 时 ， 可 能 
有 许多 字符 提供 给 了 程序 ， 而 很 多 字符 请 求 〈 如 getchar 调 用 ) 也 可 能 会 立刻 得 到 
满足 。 

当 程 序 想 在 一 个 字符 输入 时 马上 读 入 ， 所 用 的 方式 就 取决 于 行 处 理 在 输入 流 
中 的 位 置 以 及 如 何 关 掉 行 处 理 。 在 某 些 系统 下 〈 如 MS-DOS 和 某 些 模式 下 的 
VMS) ， 程 序 可 以 使 用 一 套 不 同 或 修改 过 的 操作 系统 级 函数 来 绕 过 行 输 入 模式 。 
在 男 一 些 系 统 下 (例如 UNIX 和 男 一 些 状态 下 的 VMS) ， 操 作 系 统 中 负责 串 行 输 
入 的 部 分 〈 通 种 称 为 “终端 驱动 ") 必须 设置 为 行 输入 关闭 的 模式 。 这 样 ， 后 续 的 
所 有 输入 函数 《例如 read、getchar 等 ) 就 会 立即 返回 输入 的 字符 。 最 后 ， 少 数 系 
统 《〈 特 别 是 那些 老 旧 的 批 处理 大 型 主机 ) 使 用 外 围 处 理 器 进行 输入 ， 只 有 行 处 理 
模式 。 

因此 ， 当 你 需要 用 到 单字 符 输 入 时 《关闭 键盘 回 显 也 是 类 似 的 问题 )》， 你 需 
要 使 用 针对 所 用 系统 的 特定 方法 一 一 假如 系统 提供 的 话 。 新 闻 组 comp.lang.c 讨 论 
的 问题 基本 上 都 是 C 语 言 中 有 明确 文 持 的 ， 一 般 你 会 从 针对 个 别 系统 的 新 闻 组 以 
及 相对 应 的 常用 问题 集中 得 到 更 好 的 解答 ， 例 如 comp.unix.questions 或 
comp.0s.msdos.programmer。 男 外 要 注意 ， 有 些 解 答 即 使 是 对 相似 系统 的 变种 也 不 


尽 相 同 ， 例 如 UNIX 的 不 同 变种 。 同 时 也 要 记 住 ， 当 回答 一 些 针 对 特定 系统 的 问 
题 时 ， 你 的 答案 在 你 的 系统 上 可 以 工作 并 不 代表 可 以 在 所 有 人 的 系统 上 都 工作 。 
然而 ， 这 类 问题 被 经 常 地 问 起 ， 这 里 提供 一 个 对 于 通常 情况 的 简略 回答 。 
根据 你 使 用 的 操作 系统 和 你 能 找到 的 库 ， 可 以 使 用 以 下 的 一 种 (或 几 种 ! ) 
方法 。 

某 些 版 本 的 curses 函 数 库 包含 了 cbreak[1]、noecho 和 getch 函 数 ， 这 些 函 数 可 以 
达到 你 的 要 求 。 

如 果 只 是 想 要 读 入 一 个 简短 的 口令 而 不 想 回 显 ， 可 以 试 试 getpass。〔 男 一 种 
隐藏 输入 密码 的 方法 是 在 黑 底 上 输入 黑 字 符 。) 

在 UNIX 系 统 下 ， 可 以 用 ioct 来 控制 终端 驱动 的 模式 , “传统 ”系统 下 有 
CBREAK 和 RAW 模式 ，System V 或 POSIX 系 统 下 有 ICANON、c_cc[VMIN] 和 
c_cc[VTIME] 模 式 ， 而 ECHO 模 式 在 所 有 系统 中 都 有 。 

必要 时 ， 用 函数 system 和 stty 命 令 。 更 多 的 信息 可 以 查看 所 用 的 系统 。 传 统 系 
统 下 ， 查 看 二 sgtty.h> 之 和 tty(4); System V 下 ， 碍 看 天 termio.h> 之 和 termio(4); 
POSIX F, #4 <termios.h> #lltermios(4). 

在 MS-DOS 系 统 下 ， 用 函数 getch 或 getche， 或 者 相对 应 的 BIOS 中 上 断 。 

在 VMS 下 ， 使 用 屏幕 管理 例 程 (SMG$) ， 或 curses 函 数 库 ， 或 者 低层 $QIO 
的 I0$_READVBLK 函 数 ， 以 及 IO$M_NOECHO 等 其 他 函数 。 也 可 以 通过 设置 
VMS 的 终端 驱动 ， 在 单字 符 输 入 或 “通过 ”模式 间 切 换 。 

如 果 是 其 他 操作 系统 ， 你 就 要 靠 自 己 了 。 

男 外 需要 说 明 一 点 ， 只 使 用 setbuf 或 setvbuf 来 设置 sdtin 为 无 缓冲 ， 通 常 并 不 能 
切换 到 单字 符 输 入 模式 。 

如 果 你 在 试图 写 一 个 可 移植 的 程序 ， 一 个 比较 好 的 方法 是 自己 定义 3 套 函 
数 : (1) 设 置 终端 驱动 或 输入 系统 进入 单字 符 输 入 模式 (如 果 有 必要 的 话 ) ; (2) 取 
得 字符 ; (3) 程 序 使 用 结束 后 的 终端 驱动 复原 。 理 想 上 ， 也 许 有 一 天 ， 这 样 的 一 组 
函数 可 以 成 为 标准 的 一 部 分 。 

作为 一 个 例子 ， 下 边 是 一 个 小 测试 程序 ， 可 以 打印 出 输入 的 10 个 字符 的 十 进 
制 值 而 无 需 等 待 回 车 。 这 个 程序 就 是 根据 上 述 的 3 个 函数 写成 的 。 其 后 这 3 个 函数 
在 curses、 经 典 UNIX 和 MS-DOS 下 的 实现 。 

#include<stdio. h> 


main) 


{ 
int i; 
if (tty_break () !=0) 
return 1; 
for (i=0; i<10; i++) 
printf ("=%d\n", tty_getchar () ; 
tty_fix() ; 
return 0; 
} 


三 个 函数 在 curses 下 的 实现 : 
#include<curses. h> 
int tty break () 


{ 
initserQ; 
cbreak () ; 
return 0; 
} 
int tty_getchar () 
{ 
return getch () ; 
} 
int tty_fix © 
{ 
endwin Q); 
return 0; 
} 


经 典 UNIX (V7, BSD) 下 的 实现 : 
#include<stdio. h> 
#include<sgtty. h> 


static struct sgttyb savemodes; 
static int havemodes=0; 
int tty break () 
{ 
struct sgttyb modmodes; 
if (ioctl (Fi leno (stdin), TIOCGETP, &savemodes) <0) 
return 一 1 ; 
havemodes=1 ; 
modmodes=savemodes ; 
modmodes. sg flags |=CBREAK; 
return ioctl (fileno(stdin), TIOCSETN, &modmodes) ; 
} 
int tty_getchar () 
{ 
return getchar () ; 
Jint tty_fixQ 
{ 
i f (!havemodes) 
return 0; 
return ioctl (fileno(stdin),TIOCSETN, &savemodes) ; 
} 
System V UNIX 的 实现 有 些 类 似 : 
#include<stdio. h> 
#include<termio.h>static struct termio savemodes; 
static int havemodes=0; 
int tty break () 
{ 
struct termio modmodes; 
if (ioctl (Fi leno (stdin) , TCGETA, &savemodes) <0) 


return 一 1 ; 


havemodes=1; 

modmodes=savemodes ; 

modmodes.c_Iflag &=~ ICANON; 

modmodes. c_cc[VMIN]=1; 

modmodes. c_cc[VTIME]=0; 

return ioctl (fileno(stdin) , TCSETAW, &modmodes) ; 


int tty_getchar () 
return getchar () ; 
int tty fix() 


i f (!havemodes) 
return 0; 
return ioctl (fileno(stdin),TCSETAW, &savemodes) ; 
} 
最 后 ， 这 是 MS-DOS 下 的 实现 : 
int tty break () { return 0; } 
int tty_getchar () 
{ 
return getche () ; 
} 
int tty fix() { return 0; } 
关 掉 回 显 留 作 读者 练习 。 
终端 〈 键 盘 和 屏幕 ) IO 编程 的 详情 可 以 参考 符合 你 的 操作 系统 的 FAQ 列 表 、 
书 或 文档 。 注意 ， 还 有 许多 细节 可 能 需要 考虑 ， 如 需要 关 掉 的 特殊 字符 以 及 设 
置 更 多 的 状态 位 等 。) 
参见 问题 19.2。 
参考 资料 : [12, Sec. 10 pp. 128-129, Sec. 10. 1 pp. 130-131] 


[13, Sec. 7] 


19.2 


问 : 怎样 知道 有 未 读 的 字符 GORA, ASY) ? 另外 ， 如 何在 没有 字符 的 
时 候 不 阻塞 读 入 ? 

答 : 这 些 问 题 也 是 完全 和 操作 系统 有 关 的 。 某 些 版 本 的 curses 函 数 库 有 
nodelay 函 数 。 根 据 所 用 系统 的 不 同 ， 也 许 你 可 以 使 用 * 非 阻塞 IO”、 系 统 调 用 
select 或 pol、 用 ioctl 的 FIONREAD、c_cc[VTIME]、kbhit、rdchk 或 使 用 
O_NDELAY 参 数 调用 open 或 fcntl。 你 也 可 以 设 定 闹钟 在 特定 的 时 间 间 隔 之 后 让 阻 
塞 /O 超 时 (在 UNIX 下 可 以 看 看 alarm、signal， 也 许 还 有 settimer。) 

如 果 你 希望 从 多 个 来 源 进 行 非 阻 塞 读 入 ， 坚 无 疑问 你 需要 使 用 某 种 形式 
的 “select” 调 用 ， 因 为 繁忙 等 待 的 轮 询 在 多 任务 系统 上 是 极其 低 效 的 。 

参见 问题 19.1。 


19.3 


H: 怎样 显示 一 个 在 原 地 更 新 自己 的 百分比 或 “旋转 棒 ” 的 进度 指示 器 ? 
答 : 这 很 简单 ， 你 还 可 以 得 到 相当 的 可 移植 性 。 输 出 字符 \r' 通 常 可 以 得 到 一 
个 没有 换行 的 回 车 ， 这 样 就 可 以 重 写 当 前 行 。 而 字符 \b' 代 表 退 格 ， 通 常会 使 光标 
左 移 一 格 。 
使 用 这 些 字 符 ， 可 以 这 样 输出 一 个 百分比 进度 指示 器 : 
for (i=0; i<lotsa; i++) { 
printf ("\r%3d%%", (int) (100L * i / lotsa)); 
ff lush (stdout) ; 
do _timecomsuming work () ; 
} 
printf ("\ndone. \n") ; 
或 旋转 棒 : 
printf ("working: "); 
for (i=0; i<lotsa; i++) { 


printf ("%c\b", "|/-\\"Li%4]) ; 
ff lush (stdout) ; 
do_timecomsuming_work () ; 

} 

printf ("done. \n") ; 

参见 问题 12.5。 

参考 资料 : [35, Sec. 3. 2. 2] 

[8, Sec. 5.2.2] 


19.4 


H: 怎样 清 屏 ? 怎样 反 色 输出 ? 怎样 把 光标 移动 到 指定 的 x, y 位 置 ? 

答 : 这 些 功 能 跟 你 所 用 的 终端 类 型 〈 或 显示 器 ) 有 关 。 需 要 使 用 termcap、 
term-info 或 curses 之 类 的 函数 库 ， 或 者 系统 提供 的 特殊 函数 来 完成 这 些 操作 。 

curses 库 可 以 使 用 clear、move、standout/standend 和 attromnyattroffyattrset 函 数 ; 
最 后 3 个 函数 可 以 使 用 A_REVERSE 之 类 的 属性 代码 ; 也 可 以 使 用 ANSI.SYS 驱 动 
或 底层 中 断 。 在 termcap 和 terminfo 下 ， 使 用 tgetstr 检 索 分 别 用 于 清 屏 、 反 显 模式 和 
光标 运动 字符 串 d、so/se、cm， 然 后 再 输出 这 些 字符 串 (使 用 cm 还 需要 额外 调用 
tgoto) 。 某 些 特别 的 终端 可 能 还 需要 考虑 其 他 “性 能 ”。 请 仔细 研究 相关 文档 。 注 
意 ， 有 些 老 终 端 可 能 根本 就 不 文 持 你 想 要 的 功能 。 

有 一 个 不 彻底 的 可 移植 的 清 屏 方 法 : 输出 换 页 符 〈\f) ， 这 样 能 清除 某 些 屏 
幕 。 还 有 个 更 加 可 移植 的 办 法 是 输出 足够 多 的 换行 符 ， 使 当前 屏幕 清空 。 最 后 一 
个 方法 ;使 用 system 函 数 〈 参 见 问题 19.32) 来 调用 操作 系统 的 清 屏 指令 。 

参考 资料 : [12, Sec. 5. 1. 4 pp. 54-60, Sec. 5. 1.5 pp. 60-62] 

[15] 
[16] 


19.5 


问 : 怎样 读 入 方向 键 、 功 能 键 ? 
答 : ”terminfo、 某 些 版 本 的 termcap 以 及 某 些 版 本 的 curses 函 数 库 有 对 这 些 非 


ASCII 键 的 支持 。 通 常 ， 一 个 特殊 键 会 发 送 一 个 多 字符 序列 (通常 以 ESCI[I\033"] 字 
符 开 头 ) 。 分 析 这 个 多 字符 序列 比较 矿 烦 。 如 果 你 首先 调用 了 keypad，curses 会 帮 
你 做 分 析 。 

在 MS-DOS 下 ， 如 果 你 在 读 入 键盘 输入 时 ， 收 到 一 个 值 为 0 的 字符 (不 是 字 
符 '0'! ) ， 这 就 标志 着 下 一 个 读 入 的 值 代表 一 个 特殊 键 。 有 关键 盘 的 编码 可 参见 
DOS 的 编程 指南 。 (简单 地 说 ， 上 、 下 、 左 、 右 键 的 编码 是 7 2、80、75、77， 功 
能 键 从 59 到 68。) 

参考 资料 : [12, Sec. 5. 1.4 pp. 56-57] 


ps 
fe 
(=p) 


问 : 怎样 读 入 鼠标 输入 ? 

答 : 请 查阅 你 的 系统 文档 。 鼠 标的 处 理 在 X Windown 系 统 、MD-DOS、 
Macintosh 下 是 完全 不 同 的 。 

也 许 每 个 系统 都 不 一 样 。 

参考 资料 : [12, Sec. 5.5 pp. 78-80] 


19. 


N 


问 : 怎样 做 串口 (“comm”) 的 输入 输出 ? 

答 : 这 也 是 跟 所 用 系统 有 关 的 。 在 UNIX 下 ， 通 常 可 以 打开 和 读 写 出 /dev 下 的 
一 个 设备 文件 ， 使 用 终端 驱动 提供 的 工具 来 调整 设备 的 属性 。 参见 问题 19.1 和 
19.2. ) 在 MS-DOS 下 ， 可 以 使 用 预定 义 的 stdaux 流 ， 或 特殊 文件 COM1， 或 基本 
BIOS 中 断 ， 又 或 者 你 需要 更 好 的 性 能 ， 使 用 任何 一 个 中 断 张 动 的 串口 输入 输出 
包 。 许 多 网 友 推 荐 Joe Campbell 的 书 C Programmer’s Guide to Serial 


Communications. 


—_ 
(d=) 
co 


问 : 怎样 直接 输出 到 打印 机 ? 

答 : UNIX 系 统 下 ， 使 用 popen (参见 问题 19.35) 来 把 输出 写 到 lp 或 lpr 程 序 
中 ,或 者 打开 特殊 文件 /dev/lp。 在 MS-DOS 下， 写 问 预定 义 的 stdprn 流 〈 非 标 
准 ) ， 或 者 打开 特殊 文件 PRN 或 LPT1。 

在 某 些 情况 下 ， 男 一 个 方法 (也 许 是 唯一 的 方法 ) 是 用 窗口 管理 器 的 屏幕 截 
图 功能 ， 然 后 打印 得 到 的 图 形 。 


`~ 


参考 资料 : [12, Sec. 5.3 pp. 72-74] 


19.9 


问 : 怎样 发 送 转 义 字符 序列 控制 终端 或 其 他 设备 ? 

FS: 如 果 你 能 够 找到 发 送 字符 到 设备 的 方法 《参见 问题 19.8) ， 那 么 发 送 转 
移 字 符 序列 也 是 件 很 容易 的 事 。 在 ASCII 代 码 中 ， 转 义 字 符 的 代码 是 033 十 进 制 
27) ， 以 下 代码 就 可 以 发 送 转 义 序列 ESC[ J: 

fprintf (ofd, "\033[J") ; 

有 的 程序 员 更 愿意 像 这 样 用 参数 表示 ESC 代 码 : 

#def ine ESC 033 

fprintf (ofd, "%c[J", ESC) ; 


j= 
(© 
j= 
© 


问 : 怎样 做 图 形 ? 

Z: 从 前 ，UNIX 下 有 一 套 相 当 不 错 且 小 巧 的 设备 无 关 的 绘制 函数 (plot(3) 和 
plot(5)) 。 由 Robert Maier 写 的 GNU libplot 函 数 库 保 持 了 同样 的 精神 ， 并 支持 许多 
时 新 的 绘制 设备 http://www.gnu.org/software/plotutils/plotutils.html》。 

OpenGL 是 一 个 现代 的 平台 独立 的 制图 函数 库 ， 它 也 文 持 三 维 制 图 和 动画 。 
其 他 有 关 的 制图 标准 有 GKS 和 PHIGS。 

如 果 你 在 MS-DOS 下 编程 ， 大 概 需 要 用 到 符合 VESA 或 BGI 标 准 的 函数 库 。 

如 果 你 要 和 某 一 个 特定 的 制图 仪 打交道 ， 通 常 发 送 适 当 的 转 义 序列 就 可 以 绘 
图 了 ， 参 见 问题 19.9。 广 商 可 能 会 提供 一 个 可 以 从 C 调 用 的 函数 库 ， 或 者 你 也 许可 
以 在 网 上 找到 。 


如 果 你 需要 在 某 个 特定 的 视窗 环境 下 编程 (Macintosh, X Window、 
Microsoft Windows) ， 需 要 使 用 它们 提供 的 工具 。 参 阅 相 关 的 文档 、 新 闻 组 或 
FAQ. 


参考 资料 : [12, Sec. 5.4 pp. 75-77] 


19.11 


问 : 怎样 显示 GIF 和 JPEG 图 像 ? 
答 : 这 跟 你 用 的 显示 环境 有 关 ， 有 可 能 环境 已 经 提供 了 这 些 函 数 。 
http://www.ijg.org/files/ 有 个 可 供 参 考 的 JPEG 软 件 。 


文件 和 目录 


19.12 


问 : 怎样 检验 一 个 文件 是 否 存 在 ? 如 果 请 求 的 输入 文件 不 存在 ， 我 希望 向 用 
户 提出 警告 。 

答 : 可 靠 而 可 移植 地 检测 一 个 文件 是 否 存在 出 乎 意料 地 困难 。 如 果 从 检测 到 
你 打开 文件 前 ， 这 个 文件 被 〈 别 的 进程 ) 创建 或 删除 了 ， 那 么 你 所 做 的 任何 检测 
都 会 失效 。 

3 个 可 能 用 作 检 验 的 函数 是 stat、access 和 fopen。 使 用 fopen 作 近似 检测 时 ， 用 
只 读 打 开 ， 然 后 马上 关闭 。 这 里 ， 只 有 fopen 有 广泛 的 可 移植 性 ， 如 果 系 统 提供 
access， 而 程序 用 了 UNIX 的 UID 设 置 特性 ， 则 需要 特别 小 心 。 

与 其 提前 预测 像 打 开 文 件 这 类 操作 是 否 会 成 功 ， 不 如 直接 尝试 打开 它 ， 然 后 
再 检验 返回 值 。 如 果 失 败 就 进行 错误 处 理 。 当 然 ， 除 非 打 开 文 件 有 像 O_EXCL 这 
样 的 参数 ， 否 则 如 果 你 要 避免 覆盖 已 经 存在 的 文件 ， 这 个 方法 并 不 适用 。 

参考 资料 : [12, Sec. 12 pp. 189, 213] 

[13, Sec. 5. 3. 1, Sec. 5. 6. 2, Sec. 5. 6. 3. ] 


19.13 


问 : 怎样 在 读 入 文件 前 ， 知 道 文件 大 小 ? 

答 : 如 果 “ 文 件 大 小 ” 指 的 是 你 从 C 程 序 中 可 以 读 入 (或 前 一 个 程序 写 入 ) 的 
字符 数量 ， 那 么 要 准确 地 得 到 这 个 数字 【而 不 读 入 整个 文件 ) 可 能 很 困难 或 者 根 
本 就 不 可 能 。 

UNIX 系 统 调 用 stat 〈 准 确 地 说 ， 是 stat 结 构 的 st_size 域 ) 会 给 出 准确 的 答 
案 局 。 有 些 系统 提供 了 类 似 UNIX 的 stat 调 用 ， 但 返回 的 可 能 只 是 近似 值 〈 由 于 不 
用 的 换行 表示 方法 。 参 见 问题 12.43) 。 你 可 以 打开 文件 ， 用 fstat 或 者 用 fseek 移 动 
到 文件 尾 ， 再 调用 ftell， 然 而 这 些 方法 都 有 同样 的 问题 : fstat 不 可 移植 ， 而 且 其 返 


回 和 stat 一 样 ，ftell 并 不 保证 可 以 返回 字符 计数 ， 除 非 是 用 于 二 进 制 文件 。 但 是 ， 
严格 来 讲 ， 三 进 制 文件 并 不 一 定 支 持 fseek 搜 索 到 SEEK_END。 某 些 系统 提供 
filesize 或 filelength 的 函数 ， 但 是 它们 显然 不 可 移植 。 

你 是 否 真 的 需要 预先 知道 文件 的 大 小 ?作为 一 个 C 程 序 ， 要 知道 文件 的 大 
小 ， 最 准确 的 方法 就 是 打开 文件 并 读 入 所 有 内 容 。 也 许可 以 调整 一 下 代码 ， 边 读 
入 边 计 算 文 件 大 小 。 (一般 来 襄 ， 如 果 读 到 的 字符 和 预期 不 符 ， 你 的 程序 应 该 正 
确 处 理 ， 因 为 对 大 小 的 任何 预测 都 可 能 是 近似 的 。)〉 参见 问题 7.13 和 20.2。 

参考 资料 : [35, Sec. 4.9.9. 4] 

[8, Sec. 7.9.9.4] 
[11, Sec. 15. 5. 1] 
[12, Sec. 12 p. 213] 
[13, Sec. 5. 6. 2] 


19.14 


: 怎样 得 到 文件 的 修改 日 期 和 时 间 ? 
: UNIX 和 POSIX 隙 数 是 stat， 某 些 其 他 系统 也 提供 。 参 见 问题 19.13。 


a 


19.15 


司 : 怎样 原 地 缩短 一 个 文件 而 不 用 清除 或 重 写 ? 

Æ: BSD 系 统 提供 函数 ftruncate， 菜 些 其 他 系统 提供 chsize， 还 有 少数 系统 提 
供用 于 fcnt 的 参数 F_FREESP。MS-DOS 下 ， 某 些 时 候 你 可 以 用 write(fd"",0)。 然 
而 ， 没 有 一 个 可 移植 的 方法 ， 也 没有 办 法 删除 在 文件 开头 的 数据 块 。 参 见 问 题 
19.16. 


19.16 


ae no 
答 : 一 般 来 说 ， 没 有 办 法 完成 这 个 任务 [31]。 通 常 的 解决 方案 就 是 重 写 文件 。 
当 你 觉得 需要 向 现 有 文件 中 插入 数据 的 时 候 ，; 这 里 有 几 种 方法 可 以 考虑 。 


调整 数据 文件 ， 以 便 能 够 从 尾部 增加 新 的 信息 。 

将 信息 放 入 另 一 个 文件 。 

在 文件 第 一 次 写 入 时 保留 一 些 空白 区 域 〈 如 一 个 80 字 符 的 空 行 或 0000000000 
这 样 的 域 ) ， 以 后 再 用 最 终 的 信息 重 写 。 但 要 注意 原 地 重 写 文本 文件 不 一 定 完全 
可 移植 。 重 写 文 本 文件 是 否 在 该 点 截断 文件 ，C 标 准 规定 由 实现 定义 。 

要 删除 记录 ， 你 可 以 考虑 将 它们 标记 为 “已 删除 ”， 然 后 让 读 取 文件 的 代码 忽 
略 它 们 。【〔 可 以 用 一 个 程序 不 时 重 写 文 件 ， 彻 底 扔 掉 已 删除 的 记录 。) 

参见 问题 12.32 和 19.15。 


19.17 


问 : 怎样 从 一 个 打开 的 流 或 文件 描述 符 得 到 文件 名 ? 

答 : 通常 情况 下 ， 这 没 办 法 。 在 UNIX 系 统 下 ， 理 论 上 需要 搜索 整个 磁盘 ， 
也 许 还 牵扯 到 特殊 许可 的 问题 ， 如 果 文 件 描述 符 是 连接 到 管道 (pipe) 或 者 指 问 
一 个 已 被 删除 的 文件 〈 如 果 文 件 有 多 个 连接 ， 也 许 会 返回 误导 的 信息 ) ， 那 么 搜 
索 也 会 失败 。 最 好 的 方法 就 是 在 打开 文件 时 ， 自 己 记 住 〈 或 许 用 一 个 fopen 的 封装 
函数 ) 。 


问 : 怎样 删除 一 个 文件 ? 
答 : 标准 C 库 函数 是 remove。 这 是 本 章 里 少 有 的 几 个 与 系统 无 关 的 问题 。 在 
一 些 ANSI 之 前 的 老 UNIX 系 统 ，remove 可 能 不 存在 ， 那 么 你 可 以 试 试 unlink[4]。 

参考 资料 : [19, Sec. B1.1 p. 242] 

[35, Sec. 4. 9. 4. 1] 

[8, Sec. 7.9.4.1] 

[11, Sec. 15. 15 p. 382] 

[12, Sec. 12 pp. 208, 220-221] 

[13, Sec. 5. 5. 1, Sec. 8. 2. 4] 


19.19 


问 : 怎样 复制 文件 ? 

答 : 可 以 用 函数 system 调 用 你 所 用 操作 系统 的 文件 复制 工具 。 参 见 问题 
19.32。 或 者 打开 源 文件 和 目标 文件 (用 fopen 或 一 些 底层 的 打开 文件 的 系统 函 
数 ) ， 读 入 字符 或 数据 块 ， 再 写 出 到 目标 文件 中 。 

参考 资料 : [19, Sec. 1, Sec. 7] 


19.20 


问 : 为 什么 用 了 详尽 的 路 径 还 不 能 打开 文件 ? 下 面 的 代码 会 返回 错误 。 

fopen("c:\newdir\file. dat", "r") 

答 : 你 实际 请 求 的 文件 名 内 含有 字符 \n 和 \f， 这 个 文件 可 能 并 不 存在 ， 也 不 是 
你 本 希望 打开 的 。 

在 字符 常量 和 字符 串 字 面 量 中 ， 反 和 斜 杠 \ 是 转 义 字符 ， 它 赋予 后 面 紧 跟 的 字符 
特殊 意义 。 

为 了 正确 地 把 反 斜 杠 传递 给 fopen( 或 其 他 函数 ) ， 必 须 成 对 地 使 用 ， 这 样 第 
一 个 反 和 斜 杠 引述 了 第 二 个 : 

fopen("c:\\newdir\\file. dat", "r"); 

Fi “Pie PE, ÆMS-DOS F, IER AT tH ESS AER Eo Hr a Dix 
样 用 : 

fopen("c:/newdir/file. dat", "r"); 

(注意 ， 顺 便 提 一 下 ， 用 于 预 处 理 ##nclude 指 令 的 头 文件 名 不 是 字符 串 字 面 
量 ， 所 以 不 必 担 心 反 斜 杠 的 问题 。) 


19.21 


问 : fopen 不 让 我 打开 文件 "$HOME/. profile" #2"~/. myrcfile". 
答 : 至 少 在 UNIX 系 统 下 ， 像 $4HOME 这 样 的 环境 变量 和 家 目录 的 表示 符 " 是 由 
shell 来 展开 的 。 不 存在 一 个 调用 fopenO 时 的 自动 扩展 机 制 。 


19.22 


问 : AFH] EMS-DOS FAAA Mig “Abort, Retry, Ignore?” 12.2? 
答 : 你 需要 截获 DOS 的 严重 错误 中 断 24H。 详 情 请 参阅 


comp.0s.msdos.programmer 的 FAQ。 


19.23 


问 : 2322) “Too many open files (打开 文件 太 多 ) ”的 错误 ， 怎 样 增 加 同 
时 打开 文件 的 允许 数目 ? 

答 : 通常 有 至少 两 个 资源 限制 了 同时 打开 文件 的 数目 : 操作 系统 可 用 的 底 
层 “ 文 件 说 明 符 ”或 “文件 句柄 ”的 数目 和 标准 stdio 函 数 库 可 用 的 FILE 结 构 数 目 。 两 
个 条 件 必须 符合 。 在 MS-DOS 下， 可 以 通过 设置 CONFIG.SYS 来 控制 系统 文件 句 
柄 的 数目 。 一 些 编译 器 附 有 增加 stdio 的 FILE 结 构 数目 的 指令 《也许 是 一 两 个 源 文 
件 ) 。 


19.24 


Pl: 如 何 得 到 磁盘 的 可 用 空间 大 小 ? 

答 : 没有 什么 可 移植 的 办 法 。 在 某 些 版 本 的 UNIX 下 ， 可 以 调用 statfs。 在 MS- 
DOS 下 ， 使 用 中 断 0x21 的 子 功能 0x36 或 类 似 freedisk 的 函数 。 另 一 个 可 能 的 方法 是 
用 popen 〈 人 参见 问题 19.35) 调用 一 个 “可 用 磁盘 ?命令 〈 如 UNIX 下 的 df) ， 然 后 读 
取 它 的 输出 。 

(注意 ， 由 于 各 种 原因 ， 可 用 的 磁盘 空间 大 小 并 不 一 定 等 于 你 能 创建 的 最 大 
文件 的 大 小 。) 


问 : 怎样 在 C0 语言 中 读 入 目录 ? 

答 : 试 试 能 否 使 用 opendir 和 readdir 函 数 ， 它 们 是 POSIX 标 准 的 一 部 分 ， 大 多 
数 UNIX 变 体 都 支持 。MS-DOS、VMS 和 其 他 系统 下 也 有 这 些 函 数 的 实现 。MS- 
DOS 还 有 FINDFIRST 和 FINDNEXT 函 数 ， 它 们 做 的 事情 都 基本 一 样 ，MS 
Windows 有 FindFirstFile 和 FindNext-File。readdir 只 返回 文件 名 ， 如 果 你 需要 该 文 


件 更 多 的 信息 ， 试 试 stat。 如 果 想 用 通配符 匹配 文件 名 ， 参 见 问题 13.7。 
这 个 小 例子 列 出 了 当前 目录 的 所 有 文件 : 
#include<stdio. h> 
#include<sys/types. h> 
#include<dirent. h> 


main () 
{ 
struct dirent *dp; 
DIR *dfd=opendir ("."); 
if (dfd !=NULL) { 
whi le ( (dp=readdir (dfd) ) !=NULL) 
printf ("%s\n", dp —>d_name) ; 
closedir (dfd) ; 
} 
return 0; 
} 
CERMEZRRE, BASWAMIE A HEE <directh>ek<dirh>, M 
readdir 返 回 的 指针 可 能 是 struct direct *。 这 个 例子 假设 "." 代 表 当 前 目录 。) 
必要 时 ， 你 也 可 以 用 popen〈 人 参见 问题 19.35) 调用 操作 系统 的 目录 列表 程 
序 ， 然 后 读 取 它 的 输出 。《 如 果 你 是 需要 将 文件 名 显示 给 用 户 看 ， 可 以 使 用 
system， 也 能 以 假 乱 真 。 参 见 问 题 19.32。 ) 
参考 资料 : [19, Sec. 8.6 pp. 179-184] 
[12, Sec. 13 pp. 230-231] 
[13, Sec. 5. 1] 
[30, Sec. 8] 


19.26 


问 : 如 何 创建 目录 ? 如 何 删 除 目录 (REHAB) ? 
答 : 如 果 你 的 操作 系统 支持 这 些 服务 ， 它 们 可 能 以 mkdir 和 rmdir 等 C 语 言 函 数 
的 形式 提供 。 删 除 目录 的 内 容 也 需要 列 出 它们 (参见 问题 19.25〉 并 调用 


remove〈 人 参见 问题 19.18) 。 如 果 你 没有 这 些 C 函 数 ， 那 就 试 试 system “参见 问题 
19.32) 和 你 的 操作 系统 的 删除 命令 。 
参考 资料 : [12, Sec. 12 pp. 203-204] 
[13, Secs. 5. 4. 1, 5. 4. 2] 


访问 原始 内 在 


19.27 


问 : 怎样 找 出 系统 还 有 多 少 内 存 可 用 ? 

答 : 你 所 用 的 系统 可 能 会 提供 一 个 例 程 返回 你 所 需 的 信息 ， 但 是 这 跟 系 统 相 
当 有 关 。《 而 且 ， 这 个 数字 也 会 随时 间 变 化 。) 如 果 你 希望 预测 是 否 能 够 分 配 一 
定数 量 的 内 存 ， 直 接 试 试 就 可 以 一 一 调用 malloc 请 求 需 要 的 数量 ) 然后 处 理 它 
的 返回 值 。 


19.28 


问 : 怎样 分 配 大 于 64K 的 数组 或 结构 ? 
答 : 一 台 比 较 好 的 电脑 应 该 可 以 让 你 透明 地 访问 所 有 的 有 效 内 存 。 如 果 你 没 
有 那么 好 的 运气 ， 就 可 能 需要 重新 考虑 程序 使 用 内 存 的 方式 ， 或 者 使 用 各 种 系统 
相关 的 技巧 。 
64K 仍 然 是 一 块 相当 大 的 内 存 。 不 管 你 的 电脑 有 多 少 内 存 ， 分 配 这 么 一 大 块 
连续 的 内 存 是 个 不 小 的 要 求 。 标 准 C 不 保证 一 个 对 象 可 以 大 于 32K， 或 者 C99 的 
64K。 通 常 ， 设 计数 据 结构 时 的 一 个 好 的 思想 ， 是 使 它 不 要 求 所 有 的 内 存 都 连 
续 。 对 于 动态 分 配 的 多 维 数组 ， 你 可 以 使 用 指针 的 指针 ， 在 问题 6.16 中 有 举例 说 
明 。 可 以 用 链表 或 结构 指针 数组 来 代替 一 个 大 的 结构 数组 。 
如 果 你 使 用 的 是 PC 兼容 机 (基于 8086) 系统 ， 遇 到 了 64K 或 640K 的 限制 ， 可 
以 考虑 使 用 “huge” 内 存 模 型 ， 或 者 使 用 扩充 内 存 或 扩展 内 存 ， 或 使 用 malloc 的 变 
体 函 数 halloc 和 farmalloc， 或 者 用 32 位 的 “扁平 ”(flat) 编译 器 (例如 djgpp， 参 见 
问题 18.3) ， 或 者 使 用 某 种 DOS 扩 充 器 ， 或 者 换 一 个 操作 系统 。 
参考 资料 : [35, Sec. 2. 2. 4.1] 
[8, Sec. 5.2.4.1] 
[9, Sec. 5.2.4.1] 


19.29 


问 : 错误 信息 “DGROUP data allocation exceeds 64K (DGROUP 数 据 分 配 内 
存 超过 64K) ”什么 意思 ? 我 应 该 怎么 做 ? 我 以 为 使 用 了 大 内 存 模型 ， 就 可 以 使 
用 大 于 64K 的 数据 ! 

答 : 即使 使 用 了 大 内 存 模 型 ，MS-DOS 的 编译 器 还 是 明显 地 把 某 些 数据 〈 字 
符 串 、 已 初始 化 的 全 局 或 静态 变量 ) 都 放 在 了 一 个 默认 的 数据 段 ， 而 这 个 数据 段 
溢出 了 。 可 以 减少 全 局 数据 ， 如 果 全 局 数据 已 经 限制 在 一 个 合理 的 范围 《而 引起 
问题 的 是 由 于 字符 串 的 数目 ) ， 你 可 以 告诉 编译 器 对 这 么 大 的 数据 不 要 使 用 默认 
数据 段 。 某 些 编译 器 只 把 “小 ”数据 放 在 默认 数据 段 ， 也 提供 了 设置 “小 ”数据 的 立 
值 的 方法 。 例 如 ，Microsoft 的 编译 器 可 以 用 参数 /Gt。 


19.30 


问 : 怎样 访问 位 于 某 特定 地 址 的 内 存 〈《 内 存 映射 的 设备 或 图 形 显示 内 存 ) ? 
答 : 使 用 适当 类 型 的 指针 ， 将 其 置 为 正确 的 数字 地 址 《使 用 显 式 的 类 型 转 
以 便 编 译 器 知道 这 个 不 可 移植 转换 是 你 的 意图 ) : 

unsigned int *magicloc=(unsigned int *)0x12345678; 

然后 ，*magiloc 就 指向 了 你 所 要 的 地 址 。《〈 如 果 你 希望 访问 某 个 地 址 的 字 节 
而 不 是 机 器 字 ， 可 以 使 用 unsigned char *。) 如 果 地 址 是 个 内 存 映 射 设备 的 寄存 
器 ， 你 大 概 需要 使 用 限定 词 volatile。 

MS-DOS 下 ， 在 和 上 段 、 偏 移 量 打交道 时 ， 你 会 发 现 MK_FP() 这 类 宏 非 常 好 
用 。 根 据 Gary Blaine 的 建议 ， 也 可 以 声明 一 些 机 巧 的 数组 指针 ， 可 以 让 你 用 数组 
的 方式 访问 显存 。 例 如 ， 在 一 个 80x25 的 文本 模式 的 MS-DOS 的 机 器 上 ， 使 用 这 个 
声明 

unsigned short (far videomem) [80]= 

(unsigned short (far *) [80]) 0xb8000000 ; 

就 可 用 videomem[il[j] 来 访问 第 i 行 、j 列 的 字符 和 属性 字 节 。 

很 多 操作 系统 以 保护 模式 运行 用 户 态 的 程序 ， 因 此 不 能 直接 访问 WO 设备 (或 
任何 超出 进程 范围 的 地 址 ) 。 这 种 情况 下 ， 必 须 请 求 操 作 系 统 完成 你 的 VO 任务 。 

参见 问题 4.14 和 5.19。 


换 


~ 


考 资料 : [18, Sec. A14. 4 p. 210] 
[19, Sec. A6. 6 p. 199] 
[35, Sec. 3. 3. 4] 
[8, Sec. 6. 3. 4] 
[14, Sec. 3. 3. 4] 
[11, Sec. 6.2.7 pp. 171-172] 


19.31 
问 : 如 何 访问 机 器 地 址 0 处 的 中 断 向 量 ? 如 果 将 指针 设 为 0， 编 译 


转 成 一 个 非 零 的 内 部 空 指针 值 。 
答 : 参见 问题 5.19。 


a 


可 能 把 


“系统 ”命令 


19.32 


问 : 怎样 在 一 个 C 程 序 中 调用 另 一 个 程序 〈 独 立 可 执行 的 程序 或 系统 命 
令 ) ? 

答 : 使 用 库 函 数 system， 它 的 功能 正 是 你 所 要 的 。 

有 些 系统 提供 一 族 spawn 例 程 ， 大 致 也 能 完成 类 似 的 事情 。 这 些 函 数 不 如 
system 可 移植 性 好 。 后 者 是 ANSI C 标 准 要 求 的 。 当 然 ， 无 论 如 何 ， 对 命令 串 的 解 
释 一 它 的 语法 和 可 接受 的 命令 集 一 显然 变化 其 大。 

System 函数 以 子 进程 的 方式 * 调 用” 命令， 控制 最 终 还 会 返回 调用 程序 。 如 果 
想 用 另 一 个 程序 代替 调用 程序 〈 即 “ 链 ” 操 作 ) ， 你 需要 系统 相关 的 例 程 ， 如 UNIX 
的 exec 族 函数 。 

注意 ，system 返 回 的 值 最 多 是 命令 的 退出 状态 值 〈 但 这 也 并 不 一 定 ) ， 通 常 
和 命令 的 输出 无 关 。 人 参见 问题 19.33 和 19.35。 

参考 资料 : [18, Sec. 7.9 p. 157] 
[19, Sec. 7.8.4 p. 167, Sec. B6 p. 253] 
[35, Sec. 4. 10. 4. 5] 
[8, Sec. 7. 10. 4. 5] 
[11, Sec. 19.2 p. 407] 
[12, Sec. 11 p. 179] 


19.33 


问 : 如 果 运 行 时 才 知 道 要 执行 的 命令 的 参数 〈 文 件 名 等 ) ， 应 该 如 何 调 用 
system? 

答 : 只 需 用 sprintf〈 或 strcpy 和 strcat) 将 命令 串 放 入 一 个 缓冲 区 ， 然 后 用 那个 
RIX MH system, 《确保 为 缓 补 区 分 配 了 足够 的 内 存 。 参 见 问题 7.2 和 12.23。 ) 


这 是 一 个 假想 的 例子 ， 显 示 了 如 何 创建 数据 文件 ， 然 后 对 其 排序 假设 存在 
排序 实用 程序 和 UNIX 或 MS-DOS 风 格 的 输入 /输出 重 定向 ) : 

char *datafile="file. dat"; 

char *sortedfile="file. sort"; 

char cmdbuf [50] ; 

FILE *fp=fopen (datafile, "w"); 

/* ...write to fp to build data file... */ 

fclose (fp) ; 

sprintf (cmdbuf, "sort<%s>%s", datafile, sortedfi le); 


system (cmdbuf) ; 

fp=fopen (sortedfile, "r"); 

/* ...now read sorted data from fp... */ 
19.34 


=]: 在 MS-D0S 上 如 何 得 到 system 返 回 的 准确 错误 状态 ? 

答 : 没有 办 法 。COMMAND.COM 似 乎 不 能 提供 准确 的 错误 状态 。 如 有 果 不 需 
要 COMMAND.COM 的 服务 〈 就 是 说 ， 只 是 要 调用 一 个 简单 的 程序 ， 而 不 需要 IO 
重 定向 等 ) ， 可 以 试 试 spawn 例 程 。 


19.35 


问 : 怎样 调用 另 一 个 程序 或 命令 ， 然 后 获取 它 的 输出 ? 

Z: UNIX 和 其 他 一 些 系统 提供 了 popen 函 数 ， 它 在 运行 命令 的 进程 所 连接 的 
管道 上 设置 stdio 流 ， 所 以 可 以 读 取 输出 (或 提供 输入 ) 。 使 用 popen， 问 题 19.33 
的 最 后 一 个 例子 看 起 来 会 像 这 样 : 

extern FILE *popen() ; 

sprintf (cmdbuf, "sort<%s", datafile) ; 


fp=popen (cmdbuf, "r") ; 
/* ...now read sorted data from fp... */ 


pclose (fp) ; 


(记得 结束 使 用 后 要 调用 函数 pclose。 一 开始 不 关 它 看 上 去 也 行 ， 但 最 后 会 
用 光 你 的 进程 ， 至 少 它 也 会 用 光 你 的 文件 描述 符 。) 

如 果 你 不 能 使 用 popen， 你 应 该 可 以 调用 system， 将 输出 写 入 到 一 个 可 以 打开 
和 读 取 的 文件 。 问 题 19.33 的 代码 正 是 这 样 做 的 [5]。 

如 果 使 用 UNIX， 觉 得 popen 不 够 用 ， 你 可 以 学 习 用 pipe、dup、fork 和 exec。 

顺便 提 一 下 ， 用 freopen 可 能 并 不 能 完成 这 个 任务 。 

参考 资料 : [12, Sec. 11 p. 169] 


进程 环境 


19.36 


问 : 怎样 才能 发 现 程序 自己 的 执行 文件 的 全 路 径 ? 

答 : 字符 串 arg[0] 也 许 含 有 全 部 或 部 分 路 径 ， 或 者 什么 也 没有 ， 或 者 是 个 空 指 
针 。 如 果 arg[0] 中 的 路 径 不 全 ， 你 也 许可 以 重复 命令 语言 解释 器 的 路 径 搜索 逻辑 。 
但 是 ， 没 有 确保 有 效 的 解决 方法 。 

参考 资料 : [18, Sec. 5.11 p.111] 

[19, Sec. 5. 10 p. 115] 
[35, Sec. 5. 1. 2. 2. 1] 
[8, Sec. 5. 1. 2. 2.1] 
[11, Sec. 20. 1 p. 416] 


19.37 


问 : 怎样 找 出 和 执行 文件 在 同一 目录 的 配置 文件 ? 

答 : 一 般 来 讲 ， 这 很 困难 。 这 跟 问 题 19.36 是 等 价 的 。 即 使 你 能 找 出 一 个 可 行 
的 方法 ， 你 可 能 也 应 该 考虑 通过 环境 变量 或 别 的 方法 使 程序 的 辅助 〈 函 数 库 ) H 
录 可 配置 。 如 果 程 序 会 被 多 个 用 户 使 用 ， 例 如 在 多 用 户 系统 中 ， 那 么 允许 改变 配 
置 文件 的 存放 位 置 特别 重要 。 


19.38 


问 : 进程 如 何 改变 它 的 调用 者 的 环境 变量 ? 

答 : 这 可 能 做 得 到 ， 也 有 可 能 完全 做 不 到 。 不 同 的 系统 使 用 不 同 的 方法 来 实 
现 像 UNIX 系 统 的 全 局 名 字 / 值 功能 。“ 环 境 ” 是 否 可 以 被 运行 的 进程 有 效 地 改变 ， 
以 及 如 果 可 以 ， 又 怎样 去 做 ， 这 些 都 依赖 于 系统 。 


在 UNIX 下 ， 一 个 进程 可 以 改变 自己 的 环境 〈 某 些 系 统 为 此 提供 了 setenv 或 
putenv 函 数 ) ， 被 改变 的 环境 通常 会 被 传 给 子 进程 ， 但 是 这 些 改变 不 会 传递 到 父 
进程 。〈 只 有 当 父 进程 被 显 式 设置 以 监听 某 种 改变 请 求 时 ， 父 进程 的 环境 才 可 以 
被 更 改 。) 在 MS-DOS 下 ， 总 环境 是 可 以 操作 的 ， 但 是 这 需要 星 深 难 懂 的 技巧 。 
参见 MS-DOS 的 FAQ。 


19.39 
问 : 如 何 打 开 命 令 行 给 出 的 文件 并 解析 选项 ? 
答 : 参见 问题 20.3。 
19.40 
问 : exit (status) 是 否 真 的 和 从 main 函 数 返回 同样 的 status 等 价 ? 
答 : 参见 问题 11.18。 


19.41 


H: EGE AKAM RK FEE Bl] HEP OY he? 

答 : 需要 一 个 动态 的 连接 程序 或 载 入 程序 。 也 许可 以 用 malloc 申 请 一 段 内 
存 ， 再 读 入 对 象 文件 ， 但 是 你 需要 知道 极 多 的 有 关 对 象 文 件 格式 、 地 址 变换 等 知 
识 。 而 且 如 果 代 码 和 数据 在 不 同 的 地 址 空间 或 代码 是 有 特权 的 ， 这 种 方法 就 行 不 


TA 
通 。 


~ 


在 BSD UNIX 下 ， 可 以 使 用 system 和 1d -A 来 实现 连接 。 许 多 SunO0S 和 SystemV 
的 版 本 有 -ldl 函 数 库 ， 其 中 含有 dlopen 和 dlsym 这 样 的 函数 ， 可 以 允许 动态 载 入 对 
象 文件 。 在 VMS 下， 使 用 LIB$FIND_IMAGE SYMBOL。GNU 有 个 叫 dld 的 包 可 以 
用 。 参 见 问题 15.13。 


其 他 系统 相关 的 操作 


19.42 


问 : 怎样 以 小 于 1 秒 的 精度 延 时 或 计算 用 户 响应 时 间 ? 

答 : 很 遗憾 ， 这 没有 可 移植 的 解决 方法 。VT UNIX 及 其 衍生 系统 提供 了 一 个 
相当 有 用 的 ftime 例 程 ， 可 以 提供 毫秒 级 的 精度 ， 但 在 System V 和 POSIX 中 又 没有 
这 个 例 程 了 。 下 面 是 一 些 可 以 在 你 的 系统 中 寻找 的 函数 : clock、delay、ftime、 
getimeofday、msleep、nap、napms、nanaosleep、setitimer、sleep、times 和 
usleep。 人 至 少 在 UNIX 系 统 下 ， 子 数 wait 不 是 你 想 要 的 。 函 数 select 和 poll (WR 
E) 可 以 用 来 实现 简单 的 延 时 。 在 MS-DOS 下 ， 可 以 重新 对 系统 计时 器 和 计时 器 
中 断 编程 。 

这 些 函 数 中 ， 只 有 clock 在 ANSI 标 准 中 。 两 次 调用 clock 之 间 的 差 就 是 执行 所 
用 的 时 间 ， 如 果 CLOCKS_PER_SEC 的 值 大 于 1， 可 以 得 到 精度 小 于 秒 的 计时 。 但 
是 ，clock 返 回 的 是 执行 程序 使 用 的 处 理 器 的 时 间 ， 在 多 任务 系统 下 ， 有 可 能 和 真 
实 的 时 间 相 差 很 多 。 

如 果 你 需要 实现 一 个 延 时 ， 而 你 只 有 报告 时 间 的 函数 可 用 ， 可 以 实现 一 个 
CPU 密集 型 的 繁忙 等 待 。 但 是 这 只 是 在 单 用 户 、 单 任务 系统 下 可 选 ， 因 为 这 个 方 
法 对 于 其 他 进程 极 不 友好 。 

在 多 任务 系统 下 ， 确 保 你 调用 函数 ， 让 你 的 进程 在 这 段 时 间 进 入 休 眼 状态 。 
可 用 函数 sleep、select 或 将 pause 与 alarm 或 setitimer 联 用 来 实现 。 

对 于 非常 短暂 的 延 时 ， 使 用 一 个 空 循 环 颇 有 诱惑 力 : 

long int i; 

for (i=0; i<1000000; i++) 


但 是 请 尽量 抵制 这 个 诱惑 ! 因为 ， 经 过 你 仔细 计算 的 延 时 循环 可 能 在 下 个 月 
因为 更 快 的 处 理 器 出 现 而 不 能 正常 工作 。 更 糟糕 的 是 ， 一 个 聪明 的 编译 器 可 能 注 
意 到 这 个 循环 什么 也 没 做 ， 而 把 它 完 全 优化 掉 。 


参考 资料 : [11, Sec. 18.1 pp. 398-399] 
[12, Sec. 12 pp. 197-198, 215-216] 
[13, Sec. 4. 5. 2] 


19.43 


问 : 怎样 捕获 或 忽略 contro1-0 这 样 的 键盘 中 断 ? 
答 : 基本 步骤 是 调用 signal: 
#include<signal. h> 
singal (SIGINT, SIG_IGN) ; 
就 可 以 忽略 中 断 信号 ， 或 者 : 
extern void func (int) ; 
signal (SIGINT, func) ; 
使 程序 在 收 到 中 断 信 号 时 ， 调 用 函数 func[6]。 
在 多 任务 系统 下 〈 如 UNIX) ， 最 好 使 用 更 加 深入 的 技巧 : 
extern void func (int) ; 
if (signal (SIGINT, S1G_IGN) !=S1G_1IGN) 
signal (SIGINT, func) ; 
1G SU Ab BY Ded A A WE S Be HLT AN Se ARA m H T E S 


运行 的 进程 。 在 所 有 的 系统 中 都 用 这 种 方法 调用 signal 都 不 会 带 来 负 作 用 [2]。 


19.1。 


在 某 些 系统 中 ， 键 盘 中 断 处 理 也 是 终端 输入 系统 模式 的 功能 ， 参 见 问 题 
在 茶 些 系统 中 ， 程 序 只 有 在 读 取 输 入 时 ， 才 碍 看 键盘 中 断 ， 因 此 键盘 中 断 


处 理 就 依赖 于 调用 的 输入 例 程 ( 以 及 输入 例 程 是 否 有 效 ) 。 在 MS-DOS 下 ， 可 以 
使 用 setcbrk 或 ctrlbrk。 


参考 资料 : [8, Secs. 7.7,7.7.1] 
[11, Sec. 19.6 pp. 411-413] 
[12, Sec. 12 pp. 210-212] 
[13, Secs. 3.3.1, 3. 3. 4] 


19.44 


问 : 怎样 简洁 地 处 理 浮 点 异常 ? 

答 : 在 许多 系统 中 ， 你 可 以 定义 一 个 matherr 的 函数 ， 一 旦 出 现 某 些 浮 点 错误 
时 《如 二 math.h 二 中 的 数学 例 程 出 错 ) ， 它 就 会 被 调用 。 也 可 以 使 用 signal 函 数 
(参见 问题 19.43) 拦截 SIGFPE 信 号 。 参 见 问题 14.9。 

参考 资料 : [14, Sec. 4.5.1] 


19.45 


问 : 怎样 使 用 socket? 如 何 联网 ? 如 何 写 客户 /服务 器 程序 ? 

答 : 所 有 这 些 问 题 都 超出 了 本 书 的 范围 ， 它 们 跟 你 的 网 络 设备 比 跟 C 语 言 的 
关系 更 密切 。 有 一 些 这 方面 的 好 书 : Douglas 。” Comer 撰写 的 三 卷 Internetworking 
with TCP/IP 和 W.R.Stevens 撰 写 的 UNIX Network Programming。 网 上 也 有 相当 多 这 
方面 的 信息 ， 有 “UNIX Socket FAQ” (http://www.developerweb.net/sock- 


faq/), “Beej’s Guide to NetworkProgramming”(http://www.ecst.csuchico.edu/~ 


beej/guide/net/). 
一 个 提示 : 针对 你 所 用 的 操作 系统 ， 你 也 许 需要 明确 要 求 连接 -lsocket 或 -Insl 
函数 库 。 参 见 问题 13.25。 


19.46 


问 : 怎样 调用 B10S 函 数 ? 如 何 写 1SR? 如 何 创 建 TSR? 

答 : 这 些 都 是 针对 某 一 特定 系统 的 问题 (最 可 能 的 是 运行 MS-DOS 的 PC 兼容 
HL 。 在 针对 系统 的 新 闻 组 comp.os.msdos.programmer 或 它 的 FAQ 里 你 会 取得 更 好 
的 信息 ， 另 一 个 很 好 的 资源 是 Ralf Brown 的 中 断 列 表 。 


19.47 
问 : 什么 是 “near” 和 “far” 指 针 ? 


答 : 如 今 ， 它 们 差不多 被 废弃 了 ， 它 们 肯定 与 特定 系统 有 关 。 如 果 你 真 的 要 
知道 ， 参 阅 针 对 DOS 或 Windows 的 编程 参考 资料 。 


问 : 我 不 能 使 用 这 些 非 标 准 、 依 赖 系 统 的 函数 ， 程 序 需 要 兼容 ANS11 

答 : 你 很 不 走运 。 要 么 你 误解 了 要 求 ， 要 么 这 不 可 能 做 到 。ANSIISO C 标 准 
没有 定义 做 这 些 事 的 方法 ， 它 是 个 语言 的 标准 ， 不 是 操作 系统 的 标准 。 国 际 标准 
POSIX (IEEE 1003.1, ISO/IEC 9945-1) 倒是 定义 了 许多 这 方面 的 方法 ， 而 许多 
系统 (不 只 是 UNIX) 都 有 兼容 POSIX 的 编程 接口 。 

可 能 可 以 做 到 ， 也 是 可 取 的 做 法 是 使 程序 的 大 部 分 兼容 ANSI， 将 依赖 系统 的 
功能 集中 到 少数 的 例 程 和 文件 中 。 这 些 例 程 或 文件 可 以 大 量 使 用 站 fdef 或 针对 每 一 
个 移植 的 系统 重 写 。 


19.49 


问 : 为 什么 这 些 内 容 没 有 在 C 语 言 中 进行 标准 化 ? 任何 现实 程序 都 会 用 到 这 
些 东 西 。 

答 : 实际 上 ， 己 经 有 一 些 标准 化 的 动作 了 。 刚 开始 ，C 语 言 连 个 标准 库 都 没 
有 ， 程 序 员 总 是 需要 自己 搞 一 套 功 能 函数 。 几 次 失败 的 尝试 之 后 ， 一 些 库 函数 
(包括 str * 和 stdio 函 数 族 ) 至 少 在 UNIX 上 成 了 事实 上 的 标准 ， 但 库 还 不 是 语言 的 
一 部 分 。 厂 商 可 能 〈 有 时 的 确 也 是 ) 随 他 们 的 编译 器 提供 完全 不 同 的 库 函 数 。 

在 ANSUISO C 标 准 中 ， 接 受 了 跟 语 言 本 里 地 位 一 样 的 (基于 1984 年 
的 masrgroup 标 准 和 传统 UNIX 库 兼容 的 ) 库 的 定义 。 但 标准 C 对 文件 和 设备 IO 的 
处 理 却 十 分 有 限 。 

它 提出 了 字符 流 如 何 写 入 和 读 出 文件 ， 也 提供 了 一 些 控制 字符 的 显示 建议 ， 
如 1b、\r 和 tt， 但 除 此 之 外 就 没什么 了 。 

如 果 标 准 能 够 定义 对 键盘 和 显示 器 的 访问 方法 ， 那 对 程序 员 可 能 是 个 福音 。 
但 那 却 是 个 纪念 碑 式 的 任务 : 已 经 有 大 量 不 同 的 显示 设备 和 各 不 相同 的 操作 系 


统 。 而 以 后 的 岁月 里 肯定 还 有 更 多 的 变化 。 

曾经 有 段 时 间 ，C 程 序 的 一 般 输出 设备 是 电 传 打字 机 。 然 后 是 “ 哑 ? 终 端 ， 再 
后 来 是 “智能 ”的 VT100 或 其 他 兼容 ANSI ”Xx3.64 的 终端 ， 今 天 看 来 ， 这 些 也 不 过 
是 “ 哑 ? 终 端 了 。 今 天 ， 它 的 输出 设备 很 可 能 是 点 阵 图 形 显示 器 了 。 五 年 以 后 会 是 
什么 样子 ? 那 时 候 又 会 有 什么 样 的 操作 系统 来 文 持 它 的 性 能 呢 ? 

参见 问题 11.37。 

参考 资料 : [14, Sec. 2. 2. 2, Sec. 4. 9, Sec. 4. 9. 2] 


[1]. 在 某 些 早期 版 本 的 curse 库 下 ， 请 求 一 次 一 字符 输入 的 是 crmode， 而 不 是 


cbreak. 
[21. 除 非 其 他 的 进程 正在 写 入 这 个 文件 。 


[31. 如 果 你 的 操作 系统 提供 无 序 的 、 面 向 记录 的 文件 ， 也 许 有 插入 /删除 操作 ， 但 C 
语言 没有 提供 特别 的 文 持 。 


[4]remove 和 unlink 在 语法 上 有 点 区 别 : unlink 无论 如 何在 UNIX 下 )〉 对 打开 的 文 
件 也 能 确保 有 效 ，remove 却 没有 这 样 的 保证 。 


[5L 用 system 和 临时 文件 假设 你 不 需要 被 调用 程序 和 主 程序 并 行 运 行 。 


[6]. 实 际 上 ， 可 能 有 几 种 不 同 的 键盘 终端 。 很 多 系统 上 , “中断 信号 ” 特 指 control-C 
产生 的 SIGINT。UNIX 系 统 还 有 一 个 SIGQUIT， 通 常 由 control- VAE CH 
SIGINT 和 SIGQUIT 都 可 以 绑 定 到 任何 键 上 。) 在 Macintosh 上，SIGINT 有 时 是 由 
command- 人 句号 键 产生 的 。 


[71. 在 现在 的 使 用 作业 控制 的 UNIX 系 统 上 ， 后 台 进 程 处 于 独立 的 进程 组 中 ， 因 而 
不 会 接收 键盘 中 断 。 但 这 样 调用 signal 依 然 没 有 什么 害处 ， 而 那些 无 作业 控制 shell 
的 用 户 就 会 对 你 感激 不 尽 了 。 


20% 杂项 


正如 标题 所 示 ， 本 章 涵 盖 了 那些 不 能 归 到 其 他 章节 的 一 系列 题目 。 前 两 节 是 
一 些 编程 技巧 和 单独 的 位 和 字 节 的 处 理 。 然 后 讨论 了 效率 和 C 语 言 的 Switch 语 
句 。“ 各 种 语言 功能 ”一 节 主 要 是 历史 性 的 ， 它 解释 了 C 语 言 的 一 些 功能 为 什么 像 
现在 这 个 样子 以 及 为 什么 C 语 言 没 有 包含 某 些 人 期 待 的 那些 功能 。 这 导致 了 一 些 
涉及 C 和 其 他 语言 的 问题 。 

关于 算法 人 们 写 了 整 本 整 本 的 书 ， 而 本 书 并 非 其 中 之 一 。 尽 管 如 此 ， 本 章 关 
于 算法 的 一 节 还 是 讨论 了 一 些 似乎 总 在 困扰 C 程 序 员 的 问题 。 最 后 一 节 提 供 了 一 
些 有 关 本 书 的 在 线 版 本 的 琐碎 信息 。 

本 章 的 问题 安排 如 下 : 

各 种 技巧 20.1~20.6 

位 和 字 节 20.7 一 20.13 

效率 20.14 一 20.19 

switchif#) 20.20~20.21 

各 种 语言 功能 20.22~20.29 

其 他 语言 20.31~20.33 

算法 20.34 一 20.39 

FAE [rl peed 20.40~ 20.47 


20.1 


问 : 怎样 从 函数 返回 多 个 值 ? 

答 : 有 几 种 方法 可 以 完成 这 个 任务 。《〈 这 些 例子 展示 了 假想 的 极 坐标 到 直角 
坐标 的 转换 函数 ， 必 须 同 时 返回 x 和 y 坐 标 。) 

可 以 传 入 多 个 指针 指向 不 同 的 地 址 ， 让 函数 填 入 需要 返回 的 值 : 

#include<math. h> 


*yp) 


polar to rectangular (double rho,double theta, double 


*xp=rho * cos (theta) ; 


*yp=rho * sin(theta) ; 


double x,y; 
polar to rectangular (1.,3.14, &x, &y); 
让 函数 返回 包含 需要 值 的 结构 : 


struct xycoord { double x,y; }; 


struct xycoord 
polar_to rectangular (double rho, double theta) 
{ 

struct xycoord ret; 

ret. x=rho * cos (theta) ; 

ret. y=rho * sin(theta) ; 


return ret; 


struct xycoord c=polar to rectangular (1.,3.14); 


结合 起 来 : 让 函数 接受 结构 指针 ， 然 后 再 填 入 需要 的 数据 : 


*xp, double 


polar to rectangular (double rho, double theta, struct xycoord *cp) 


{ 
cp->x=rho * cos (theta) ; 
cp->y=rho * sin(theta) ; 


struct xycoord c; 


polar_to rectangular (1.,3.14, &c); 


( 男 一 采用 这 种 技术 的 例子 是 UNIX 的 系统 调用 stat。) 
不 得 已 的 时 候 ， 理 论 上 你 也 可 以 采用 全 局 变量 (但 这 并 不 是 个 好 主意 ) 。 
参见 问题 2.8、4.8 和 7.7。 


20.2 


问 : 用 什么 数据 结构 存储 文本 行 最 好 ? 我 开始 用 固定 大 小 的 char 型 数组 的 数 
组 ， 但 是 有 很 多 局 限 。 

答 : 一 种 好 办 法 是 用 一 个 指针 模拟 一 个 数组 〉 指 同一 系列 的 char 型 指针 
《每 个 模拟 一 个 数组 ) 。 

这 种 数据 结构 有 时 被 称 为 不 规则 数组 〈ragged array) ， 看 起 来 像 这 个 样子 : 


afio 
[efe] a [efe 


用 这 样 的 简单 声明 就 可 以 设置 好 图 中 的 小 数组 : 
char *a[4]={"this","is", "a", "test"}; 
char **p=a; 
(其 中 p 是 一 个 char 型 的 指针 的 指针 ， 而 a 是 个 中 间 数 组 ， 用 于 为 4 个 char 型 指 
针 分 配 空间 。 ) 
要 真正 地 动态 分 配 内 存 ， 你 当然 需要 调用 malloc: 
#include=stdlib.h> 
char **p=malloc(4 * sizeof (char *)) ; 
if (p !=NULL) { 
p[0]=mal loc (5) ; 
pL1]=mal loc (3) ; 
p[2]=mal loc (2) ; 
pL3]=mal loc (5) ; 
if(p[0] && pli] && pl2] && pl3)){ 
strcpy (p[0], "this") ; 


strcpy (p[1], "is"); 
strcpy (p[2], "a") ; 
strcpy (p[3], "test"); 


} 


《有些 库 提供 了 strdup 函 数 ， 它 可 以 同时 完成 内 部 的 malloc 和 strcpy 调 用 。 这 


个 不 标准 ， 但 要 实现 一 个 类 似 的 东西 显然 也 很 容易 。 ) 


这 段 代 码 用 同样 的 不 规则 数组 将 整个 文件 读 入 内 存 。 这 段 代 码 使 用 了 问题 


7.34 的 agetline 函 数 。 


#include<stdio. h> 
#include<stdl ib. h> 
extern char *agetline(FILE *) ; 
FILE *ifp; 
/* assume ifp is open on input file */ 
char **| ines=NULL; 
size_t nal loc=0; 
size_t nlines=0; 
char *p; 
while ((p=aget! ine (ifp)) !=NULL ) { 
if (nl ines>=nal loc) { 

nal loct=50; 
#ifdef SAFEREALLOC 

lines=realloc(lines, nalloc * sizeof (char *)); 
#else 

if (| ines==NULL) /* in case pre 

realloc */ 
lines=malloc(nalloc * sizeof (char *)); 

else | ines=realloc(lines, nalloc * sizeof (char*)) ; 
#endif 

if (| ines==NULL) { 


ANS | 


fprintf(stderr, "out of memory") ; 
exit (1); 


} 

lines[nl ines++]=p; 
} 
《参见 问题 7.34 关 于 再 分 配 策略 的 注释 。) 
参见 问题 6.16。 


20.3 


问 : 怎样 打开 命令 行 提 到 的 文件 并 处 理 参 数 ? 
答 : 这 是 个 实现 了 传统 的 UNIX 风 格 的 argv 处 理 的 骨架 ， 处 理 了 以 -开始 的 选 
项 及 可 选 的 文件 名 。 
《本 例 接受 的 两 个 选项 是 -a 和 -b，-b 带 一 个 参数 。) 
#include <stdio.h> 
#include <string.h> 
#include< errno.h > 
main(int argc,char *argv[]) 
{ 
int argi; 
int aflag=0; 
char *bval=NULL; 
for(argi=1; argi<argc & & argv[argi][0]=='-'; argi++){ 
char *p; 
for(p= & argv[argi][1]; *p !="\0'; p++){ 
switch(*p){ 
case 'a': 
aflag=1; 
printf("-a seen\n"); 
break; 


case 'b': 
bval=argv[++argi]; 
printf("-b seen (\"%s\")\n"",bval); 
break; 

default : 


fprintf(stderr, "unknown option —%c\n", *p) ; 


} 
if (argi >=argc) { 
/* no filename arguments; process stdin */ 
printf ("processing standard input\n") ; 
} else { 
/* process filename arguments */ 
for(; argi<argc; argi++) { 
FILE *ifp=fopen(argvlargi], "r") ; 
if (i fp==NULL) { 
fprintf(stderr, "can't open %s: %s\n", 


argvlargi], strerror (errno) ) ; 


continue; 
} 
printf (" processing %s\ n" ,argv[ argi ]);fclose ( ifp ); 
} 
} 
return 0; 


} 

(这 段 代 码 假设 fopen 会 在 失败 时 设置 errno， 这 一 点 不 能 确保 ， 但 多 数 时 候 都 
可 以 ， 而 且 这 样 的 错误 信息 会 更 有 用 处 。 参 见 问题 20.4。) 

有 几 个 现成 的 函数 可 以 用 标准 的 方式 解析 命令 行 ， 其 中 最 流行 的 就 是 
getopt《〈 人 参见 问题 18.20) 。 这 是 用 getopt 重 写 的 上 边 的 例子 : 


extern char *optarg; 
extern int optind; 
main(int argc, char *argv[]) 
{ 
int aflag=0; 
char *bval=NULL; 


int c; 
whi le ((c=getopt (argc, argv, "ab:")) !=-1) 
switch (c) { 
case ‘a’: 
af lag=1; 
printf ("-a seen\n") ; 
break; 
case 'b': 
bval=optarg; 
printf ("-b seen (\"%s\") \n", bval) ; 
break; 


} 
if (optind>=argc) { 
/* no filename arguments; process stdin */ 
printf ("processing standard input\n") ; 
} else { 
/* process filename arguments */ 
for(; optind<arge ; optind++) { 
FILE *ifp=fopen(argvloptind], "r"); 
if (i fp==NULL) { 
fprintf(stderr, "can't open %s: %s\n", 
argv [optind], strerror (errno) ) ; 


continue; 


printf ("processing %s\n", argvLoptind]) ; 
fclose (ifp); 


} 
return 0; 

} 

上 边 的 例子 忽略 了 几 个 细微 的 问题 : 单独 的 “-” 通 常 表示 “从 标准 输入 读 入 ”，- 
-标志 通常 表示 选项 的 结束 《〈 某 些 版 本 的 getopt 的 确 能 处 理 这 个 ) ， 传 统 上 如 果 用 
错误 的 参数 或 不 提供 参数 调用 命令 会 给 出 用 法 信息 。 

如 有 果 你 想 知 道 argv 在 内 存 中 是 如 何 存放 的 ， 那 么 它 是 个 “不 规则 数组 ”。 人 参见 
问题 20.2 的 插图 。 

参考 资料 : [18, Sec. 5. 11 pp. 110-114] 

[19, Sec. 5. 10 pp. 114-118] 

[35, Sec. 5. 1. 2. 2. 1] 

[8, Sec. 5. 1. 2. 2.1] 

[11, Sec. 20.1 p. 416] 

[12, Sec. 5.6 pp. 81-82,Sec.11 p.159, pp. 339-340 Appendix 


F] 
[30, Sec. 4 pp. 75-85] 


20.4 


问 : 如 何 正 确 地 使 用 errno? 

答 : 通常 应 该 检查 返回 值 来 检测 错误 ， 而 ermo 应 该 只 用 来 区 分 各 种 错误 原 
因 ， 如 “文件 不 存在 ”或 “权限 不 足 ” 等 。 (通常 可 以 用 perror 或 strerror 打 印 这 些 错误 
信息 。) 只 有 当 函 数 没有 唯一 的 、 明 确 的 越界 错误 返回 时 《就 是 说 ， 所 有 的 返回 
值 都 是 正确 的 ， 如 atoi) 才 有 必要 用 ermo 来 探测 错误 。 这 些 情况 下 (也 只 有 在 这 
些 情况 下 ， 碍 碍 文 要 ， 看 函数 是 否 允 许 这 样 ) 才能 将 ermo 置 为 0， 调 用 函数 ， 然 
后 再 检查 ermo 的 值 来 判断 是 否 出 错 了 。 “〈 先 将 errno 置 为 0 很 重要 ， 因 为 没有 库 函 
数 会 为 你 代劳 。) 

要 使 错误 信息 有 用 ， 得 包含 所 有 相关 信息 。 除 了 用 strerror 从 ermo 得 到 的 文 


本 ， 同 时 打印 出 程序 名 称 、 失 败 的 操作 (最 好 以 用 户 能 理解 的 方式 ) 、 操 作 失 败 
的 文件 名 以 及 输入 文件 (脚本 或 源 文 件 ) 的 当前 行 号 也 很 好 。 
参见 问题 12.26。 
参考 资料 : [35, Sec. 4. 1. 3, 4. 9. 10. 4, 4. 11. 6. 2] 
[8, Sec. 7. 1. 3, 7.9. 10. 4, 7. 11. 6. 2] 
[22, Sec. 5. 4 p. 73] 
[12, Sec. 11 p. 168, Sec. 14, p. 254] 


20.5 


问 : 怎样 写 数据 文件 ， 使 之 可 以 在 不 同 字 大 小 、 字 节 顺 序 或 浮 点 格式 的 机 器 
上 读 入 ? 

答 : 最 可 移植 的 方法 是 用 文本 文件 〈 通 常 是 ASCII) ， 用 fprintf 写 入 ， 用 
fscanf 或 类 似 的 函数 读 入 。 同 理 ， 这 也 适用 于 网 络 协议 。 不 必 太 相信 那些 说 文本 文 
件 太 大 或 读 写 太 慢 的 论点 。 大 多 数 现 实情 况 下 ， 操 作 的 效率 是 可 接受 的 ， 而 可 以 
在 不 同 机 器 间 交 换 和 用 标准 工具 就 可 以 对 其 进行 操作 是 个 巨大 的 优势 。 

如 果 必 须 使 用 二 进 制 文件 ， 可 以 通过 使 用 某 些 标准 格式 来 提高 可 移植 性 ， 还 
可 以 利用 已 经 写 好 的 IO 函数 库 。 这 些 格式 包括 : Sun 的 XDR (RFC 1014) 、OSI 
的 ASN.1 (在 CCITT X.409 和 ISO 8825“Basic Encoding Rules” 中 都 有 引用 ) ~ 
CDF、netCDF 或 HDF。 参 见 问 题 2.13 和 12.41。 

参考 资料 : [12, Sec. 6 pp. 86, 88] 


20.6 


问 : 怎样 用 char * 指 针 指 向 的 耳 数 名 调用 逊 数 ? 这 样 : 
extern int func (int, int); 

char *funcname=" func"; 

int r=(*funcname) (1, 2) ; 

或 这 样 : 

r=(* (int (*) (int, int)) funcname) (1, 2) ; 
好 像 都 不 行 。 


答 : 程序 运行 的 时 候 ， 函 数 和 变量 的 名 称 信息 〈“ 符 号 表 ”) 就 不 再 需要 了 ， 
因此 也 可 能 没有 了 。 

因此 ， 最 直接 的 方法 就 是 自己 维护 一 个 名 字 和 函数 指针 的 列表 : 

int one func(), two func(); 

int red_func(), blue func (0 ; 

struct { char *name; int (*funcptr) () } symtab[]={ 


"one_func", one_func, 
"two_ func", two_func, 
"red func", red_func, 
"blue func", blue_func, 
bs 
然后 搜索 函数 名 ， 就 可 以 函数 指针 调用 对 应 的 函数 了 : 
#include<stddef. h> 
int (*findfunc (char *name) ) () 


{ 


int 1; 
for (i=0; i<sizeof (symtab)/ sizeof (symtab[0]); i++) { 
if (strcmp (name, symtab[i]. name) ==0) 
return symtabLi].funcptr; 
} 
return NULL; 


char *funcname="one_func"; 
int (*funcp) ()=findfunc (funcname) ; 
if (funcp !=NULL) 
(kfuncp) C) ; 
这 些 被 调用 函数 的 参数 和 返回 值 应 该 兼容 。【《〈 理 想 状 态 下 ， 函 数 指针 应 该 也 
旨 明 参数 类 型 。 ) 有 时 候 程序 可 以 读 取 它 本 喘 的 符号 表 ， 如 果 它 还 存在 的 话 。 但 
它 必 须 先 找到 上 自己 的 执行 文件 (参见 问题 19.36。) ， 而 且 它 还 必须 知道 如 何 解释 


符号 表 (有 的 UNIX C 库 提供 nlist 函 数 ， 用 于 这 个 目的 ) 。 参 见 问题 2.16、18.15 和 
19.41。 
参考 资料 : [12, Sec. 11 p. 168] 


H 
aw 


20.7 


问 : 如 何 操作 各 个 位 ? 
答 : 在 C 语 言 中 的 位 操作 直截了当 。 要 取出 《检测 ) 茶 位 ， 可 以 配合 代表 你 


感 兴趣 的 位 的 掩 码 使 用 按 位 与 (&) 操作 符 : 


value & Ox04 

要 置 位 ， 可 以 使 用 按 位 或 (| 或 =)〉 操作 符 : 

value |=0x04 

要 清除 某 位 ， 可 以 使 用 按 位 反 《〈 一 ) Rigi (&RM&=) 操作 符 : 
value &=~0x04 

《前边 的 3 个 例子 都 对 右 起 第 3 位 进行 操作 ， 亦 即 22 位 ， 用 常数 乓 人 码 表示 为 


0x04。) 要 操作 任意 位 ， 可 以 用 左 移 操 作 符 《〈 芝 入) 生成 需要 的 掩 码 : 


value & (1<<bitnumber) 

value |=(1<<bitnumber) 

value &=~ (1<<bitnumber) 

也 可 以 预先 算出 一 个 掩 码 数组 : 

unsigned int masks[]= 

{0x01, 0x02, 0x04, 0x08, 0x10, 0x20, 0x40, 0x80} ; 

value & masks[bitnumber | 

value |=masks[bitnumber] 


value &=~masks[bitnumber | 


要 避免 符号 位 带 来 的 意外 ， 最 好 在 代码 中 使 用 无 符号 整数 类 型 操作 位 和 字 


a 


参见 问题 9.2 和 20.8。 
参考 资料 : [18, Sec. 2.9 pp. 44-45] 


[19, Sec. 2.9 pp. 48-49] 
[35, Sec. 3. 3. 3. 3, Sec. 3. 3. 7, Sec. 3. 3. 10, Sec. 3. 3. 12] 
[8, Sec. 7. 3. 3. 3, Sec. 7. 3. 7, Sec. 7. 3. 10, Sec. 7. 3. 12] 


[11, Sec. 7.5.5 p. 197, Sec. 7.6.3 pp. 205-206, Sec. 7.6.6 p.210 


20.8 


问 : 怎样 实现 位 数组 或 集合 ? 


答 : 使 用 int 或 char 数 组 ， 再 加 上 访问 所 需 位 的 几 个 宏 。 这 里 有 一 些 用 于 char 


型 数组 的 简单 宏 定义 : 


#include<limits.h>/* for CHAR BIT */ 

#define BITMASK (b) (1<<((b)% CHAR_BIT)) 

#define BITSLOT (b) ((b) / CHAR_BIT) 

#def ine BITSET (a,b) ((a) [BITSLOT (b)] |=BITMASK (b) ) 
#def ine BITCLEAR (a, b) ( (a) [BITSLOT (b)] &=~BITMASK (b) ) 
#def ine BITTEST (a, b) ((a) [BITSLOT (b)] & BITMASK (b)) 
#def ine BITNSLOTS (nb) ((nb+CHAR_BIT - 1)/ CHAR_BIT) 

(如 果 你 没有 <limitsh>， 可 以 将 定义 CHAR_BIT 定 义 为 8。) 
下 面 是 一 些 实 用 的 例子 。 

声明 一 个 47 位 的 “数组 ”: 

char bitarray[BITNSLOTS (47) ] ; 

置 第 23 位 : 

BITSET (bitarray, 23) ; 

测试 第 35 位 : 

if (BITTEST (bitarray, 35))... 

计算 两 个 位 数组 的 并 ， 再 将 结果 放 入 男 一 个 数组 (三 个 数组 都 如 前 文 声 


明 ) : 


for (i=0; i<BITNSLOTS (47); i++) 
array3[i]=array1[i] | array2[i]; 
要 计算 交 ， 使 用 & 而 不 是 | 操作 符 。 


作为 一 个 更 现实 的 例子 ， 这 里 有 个 用 得 法 〈Sieve of Eratosthenes) 计算 素数 
的 快速 实现 : 
#include<stdio. h> 
#include<string. h> 
#def ine MAX 10000 
int main() 
{ 
char bitarray[BITNSLOTS (MAX) ] ; 
int i,j; 
memset (bitarray, 0, BI TNSLOTS (MAX) ) ; 
for (i=2; i<MAX; i++) { 
if (IBITTEST (bitarray, i)) { 
printf ("%d\n", i); 
for (j=iti; j<MAX; j+=i ) 
BITSET (bitarray, j); 


} 


return 0; 


} 
参见 问题 20.7。 
参考 资料 : [11, Sec. 7.6.7 pp. 211-216] 


» 


问 : 怎样 判断 机 器 的 字 节 顺序 是 高 字 节 在 前 还 是 低 字 市 在 前 ? 
答 : 有 个 使 用 指针 的 方法 : 
int x=1; 
if (* (char *) &x==1) 
printf ("little - endian\n") ; 
else 


printf ("big - endian\n") ; 


另外 一 个 方法 是 用 联合 : 
union { 
int i; 
char clsizeof (int) ]; 
Fxg 
x. 1=1; 
if (x. c [0]==1) 
printf ("little - endian\n") ; 
else 
printf ("big - endian\n") ; 
参见 问题 10.16 和 20.10。 
参考 资料 : [11, Sec. 6. 1.2 pp. 163-164] 


20.10 


问 : 怎样 调换 字 节 ? 


答 : V7 UNIX 有 一 个 swap0 的 函数 ， 但 似乎 被 遗 


使 用 显 式 的 字 节 调换 代码 有 个 问题 ， 就 是 你 必须 决定 是 否 要 调用 ， 参 


20.9。 更 好 的 方法 是 使 用 函数 “例如 BSD 系 统 中 的 网 络 函 数 ntohs 等 


行 已 知 字 符 


序 ， 函 数 不 作 任何 转换 。 
S 两 个 明显 的 方法 就 是 使 用 指针 或 联合 ， 就 
像 问 题 20.9 一 样 。 这 是 一 个 使 用 指针 的 例子 : 


void eons us *ptr, int nwords) 
{ 
char *p=ptr; 
while(nwords —->0) { 
char tmp=*p; 
*p=* (p+1) ; 
* (p+1) =tmp ; 
pt=2; 


URE AA LAS UA RAD 之 间 的 转换 ， 对 于 已 经 和 机 器 匹配 的 字符 大 


} 
这 是 使 用 联合 的 例子 : 
union word 
{ 
short int word ; 
char halves[2] ; 
i 
void byteswap (char *ptr, int nwords) 
{ 
register union word *wp= (union word *) ptr; 
whi le (nwords—->0) { 
char tmp=wp->halves [0]; 
wo->halves[0]=wp->halves[1]; 
wo->halves[1]=tmp; 


wpt+ ; 


} 

这 些 函 数 交 换 二 字 节 的 数字 ， 要 扩展 到 四 字 节 或 更 多 字 节 很 容易 。 使 用 联合 
的 代码 并 不 完美 ， 因 为 它 假 设 传 入 的 指针 已 经 按 机 器 字 对 齐 了 。 也 可 以 写 出 接受 
独立 的 源 指针 和 目的 指针 的 函数 ， 或 者 接受 单个 的 机 器 字 返 回 交 换 后 的 值 。 

参考 资料 : [12, Sec. 11 p. 179] 


20.11 


问 : 怎样 将 整数 转换 到 二 进 制 或 十 六 进 制 ? 

答 : 确定 你 真 的 知道 你 在 问 什 么 。 整 数 是 以 二 进 制 存 储 的 ， 虽 然 在 大 多 数 情 
况 下 ， 把 它们 当成 是 八进制 、 十 进 制 或 十 六 进 制 并 没有 错 ， 只 要 方便 就 好 。 数 字 
表达 的 进 制 只 有 在 读 入 或 写 出 到 外 部 世界 时 才 起 作用 。 

在 源 程序 中 ， 非 十 进 制 的 数字 由 前 面 的 0 或 0x 表 示 “分 别 为 八进制 和 十 六 进 
制 )。 在 进行 WO 操作 时 ， 数 字 格 式 的 进 制 在 printf 和 scanf 这 类 函数 里 ， 由 格式 说 


明 符 决定 〈%d、%o 和 %x 等 ) 。 在 strtol 和 strtoul 中 ， 则 由 他 们 的 第 3 个 参数 决定 。 
在 二 进 制 WO 中 ， 进 制 义 变 得 没有 实质 意义 了 ， 因 为 如 果 数 字 以 独立 字 节 (通常 用 
getc 或 putc) 或 多 字 节 的 机 器 字 【〈 通 常用 fread 或 fwrite) 进行 读 写 ， 再 问 它们 的 “ 进 
制 ”就 没什么 意义 了 。 

如 果 需 要 的 是 格式 化 的 二 进 制 转 换 ， 那 就 很 容易 了 。 这 是 一 个 进行 任意 进 制 
数 转换 的 小 函数 : 


char * 


baseconv (unsigned int num, int base) 
{ 
static char retbuf [33] ; 
char *p; 
if (base<2 || base>16) 
return NULL ; 
p= & retbuf [sizeof (retbuf) -1] ; 
*p=" NO 4 
do { 
*——p="0123456789abcdef"[num % basel; 
num /=base; 
} while(num !=0) ; 
return p; 
} 
注意， 这 个 函数 返回 指向 静态 数据 的 指针 ， 因 此 每 次 只 能 使 用 一 个 返回 
值 。 参 见 问 题 7.7。 更 好 的 retbuf 大 小 应 该 是 sizeof(inb*CHAR_BIT+1。 参 见 问 题 
12.23. ) 
有 关 “ 二 进 制 ?TO 的 更 多 信息 ， 请 参见 问题 2.12、12.40 和 12.45。 
参见 问题 8.6 和 13.1。 
参考 资料 : [35, Secs. 4. 10. 1.5, 4. 10. 1.6] 
[8, Secs. 7. 10. 1. 5, 7. 10. 1. 6] 


20.12 


问 : 可 以 使 用 二 进 制 常数 〈 类 似 0b101010 这 样 的 东西 ) 吗 ? printf 有 二 进 制 
的 格式 说 明 符 吗 ? 

答 : 两 个 都 不 行 。 可 以 用 strtol 把 二 进 制 的 字符 串 转 换 成 整数 。 如 果 要 用 二 进 
制 打 印 数 字 ， 可 以 参见 问题 20.11 的 示例 代码 。 


H: 用 什么 方法 计算 整数 中 为 1 的 位 的 个 数 最 高 效 ? 
答 : 许多 像 这 样 的 位 问题 可 以 使 用 查找 表格 来 提高 效率 和 速度 (参见 问题 
20.14) 。 这 段 代 码 是 以 每 次 4 位 的 方式 计算 数值 中 为 1 的 位 的 个 数 的 小 函数 : 
static int bitcounts[]= 
{0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4} ; 


int bitcount (unsigned int u) 


{ 
int n=0; 
for(; u !=0; u>>=4) 
nt+=bitcounts[u & Ox0f]; 
return n; 
} 


问 : 怎样 提高 程序 的 效率 ? 

答 : 效率 尽管 是 个 极其 流行 的 话题 ， 但 它 却 往 往 并 不 像 人 们 想象 的 那样 重 
要 。 多 数 程序 中 的 多 数 代码 并 非 时 间 敏 感 的 ， 而 一 旦 不 那么 时 间 敏 感 ， 写 得 清楚 
而 可 移植 就 更 加 重要 了 。〈 记 住 计 算 机 非常 非常 快 ， 就 算是 “ 低 效率 ”的 代码 ， 跑 
起 来 也 没有 明显 的 延迟 。) 

预测 程序 的 “热点 ?是 个 非常 困难 的 事情 。 当 需要 关心 效率 时 ， 使 用 分 析 软 件 
来 确定 程序 中 需要 关注 的 地 方 很 重要 。 通 帝 ， 实 际 计算 时 间 都 被 外 围 任务 〈 如 IO 
或 内 存 的 分 配 ) 占用 了 ， 可 以 通过 使 用 缓冲 区 和 超 高 速 缓存 来 提高 速度 。 

即使 对 于 时 间 敏 感 的 代码 ， 对 代码 细节 进行 “微调 优化 ”也 不 那么 重要 。 许 多 


经 常 被 建议 的 “高 效 的 编码 技巧 ”即使 是 很 简单 的 编译 器 也 会 自动 完成 。 很 多 第 
手 笨 脚 的 优化 企图 把 代码 弄 得 笨重 不 堪 ， 因 为 缺 页 数量 的 增加 和 指令 缓存 及 流水 
线 的 溢出 实际 会 导致 性 能 下 降 。 而 且 优 化 技巧 也 鲜 有 可 移植 的 。( 例 如， 也 许 在 
某 台 机 器 上 提 了 速 ， 但 在 另 一 台 机 器 上 却 变 慢 了 。) 任何 情况 下 ， 修 整 代码 通常 
最 多 得 到 线性 性 能 提高 ， 只 有 采用 更 好 的 算法 才 可 以 得 到 更 高 的 回报 。 

如 果 代 码 性 能 真 的 那么 重要 ， 使 你 愿意 在 源码 级 的 优化 上 投入 编程 时 间 ， 那 
么 请 确保 你 使 用 了 能 负担 得 起 的 最 好 的 优化 编译 器 。〔 即 使 一 般 的 编译 器 也 能 提 
供 在 源码 级 上 不 可 能 的 优化 。) 

如 果 效 率真 的 很 重要 ， 也 已 经 选择 了 最 好 的 算法 ， 甚 至 编码 的 细节 也 有 影 
啊 ， 那 么 下 边 的 建议 也 许 有 用 。“ 提 到 这 些 建议 不 过 是 因为 这 个 问题 总 被 问 到 ， 
这 并 不 意味 着 作者 认可 它们 。 注 意 这 里 有 些 技巧 是 双 娘 剑 ， 使 用 不 当 可 能 导致 更 
坏 的 结果 。) 

对 常用 的 变量 使 用 register 声 明 ， 如 果 可 行 ， 在 内 部 块 中 使 用 。〈 男 一 方面 ， 
基于 它们 会 比 程序 更 好 地 进行 寄存 器 分 析 的 假设 ， 多 数 现 代 编 译 器 会 忽略 register 
声明 。) 

仔细 检查 算法 。 尽 可 能 地 利用 对 称 压缩 明确 条 件 的 个 数 。 

检查 控制 流 ， 确保 一 般 情况 先 检查 并 且 处 理 得 更 人 简单。 如果 及 发 或 | 的 某 一 侧 
通常 决定 表达 式 的 结果 ， 只 要 可 能 就 把 它 放 到 左边 。( 参 见 问 题 3.7。) 

可 能 的 情况 下 使 用 memcpy 人 代替 memmove。 “参见 问题 11.27。) 

使 用 机 器 相关 和 广 商 特 定 的 例 程 及 元 ragma。 

手工 将 公共 子 表达 式 置 入 临时 变量 。〈 好 的 编译 器 会 为 你 代劳 。) 

将 关键 的 内 循环 代码 移出 函数 ， 置 入 宏 或 内 联 (inline) 函数 中 。 如 果 不 变 ， 
移出 循环 。 如 果 循 环 的 终止 条 件 很 复杂 但 并 不 随 循环 变化 ， 可 以 先 计 算 ， 将 结 
置 入 临时 变量 中 。 (好 编译 器 也 可 代劳 。) 

如 果 可 能 ， 将 递归 改 为 迭代 。 

打开 小 循环 。 

比较 while、for 还 是 do/while 循 环 在 你 的 编译 器 下 生成 最 好 的 代码 ， 检 查 增 加 
还 是 减少 循环 控制 变量 运行 得 最 好 。 

去 掉 goto 语 句 一 有 的 编译 器 在 有 它 存 在 的 时 候 不 能 优化 得 那么 好 。 

用 指针 而 不 是 数组 下 标 检索 数组 (但 请 参见 问题 20.4) 。 


降低 精度 。“〈 用 float 代 蔡 double 可 能 会 在 ANSI 编 译 器 下 导致 更 快 的 单 精 度 算 
术 。 但 ANSI 前 的 编译 器 把 一 切 都 转换 成 double， 所 以 使 用 float 可 能 还 会 更 慢 。) 
将 耗 时 的 三 角 函 数 和 对 函数 换 成 你 自己 的 版 本 ， 根 据 需 要 的 范围 和 精度 进行 微 
调 ， 也 许可 以 使 用 得 表 法 。 【确保 你 自己 的 版 本 使 用 不 同 的 名 称 。 参 见 问 题 
1.30. ) 

绥 存 或 预先 计算 第 用 值 表 。 参见 问题 20.13。) 

优先 使 用 标准 库 函 数 而 不 是 你 自己 的 版 本 。 (有 时 候 ， 编 译 器 会 内 联 化 或 特 
别 优化 它 自己 的 版 本 。)〉 男 一 方面 ， 如 果 你 的 程序 的 调用 模式 十 分 普通 ， 你 自己 
的 专用 实现 也 许可 以 击败 库 里 的 通用 版 本 。 同样 ， 如 果 你 要 写 自己 的 版 本 ， 给 
它 一 个 不 同 的 名 字 。) 

最 后 ， 最 后 一 招 ， 用 汇编 手工 编写 关键 代码 (或 者 对 编译 器 的 汇编 输出 进行 
手工 微调 ) 。 如 果 可 能 ， 使 用 asm 指 令 。 

这 些 问 题 不 用 考虑 : 

i++ 是 否 比 i=i+1 更 快 ; 

i<<1 (及 i>>1 或 1i& 1) 是 否 比 i* 2 〈 及 iy 2 或 1% 2) 更 快 。 (这些 是 通常 
由 编译 器 为 你 完成 的 优化 。 参 见 问题 20.15 和 20.16。 ) 

这 里 并 没有 上 暗示 效率 可 以 完全 和 忽略。 然而 多 数 时 候 ， 只 需 选 择 好 的 算法 ， 整 
洁 地 实现 ， 再 避免 明显 的 低 效 失误 例如， 确保 你 不 会 把 一 个 O(n”) 的 算法 实现 成 
O(n?)) ， 就 可 以 取得 合意 的 绝 佳 效果 。 

有 关 效 率 的 更 多 讨论 ， 以 及 当 效 率 很 重要 时 如 何 提高 效率 的 建议 ， 可 以 从 以 
下 书 中 得 到 : Kernighan 和 Plauger 的 The Elements of Programming Style[17] 的 第 7 
=, Jon Bentley 的 Writing Efficient Programs[2]。 

参见 问题 17.11。 


20.15 


问 : 指针 真 的 比 数组 快 吗 ? 函数 调用 会 拖 慢 程序 多 少 ? ++i 比 i=i+1 快 吗 ? 

答 : 这 些 问 题 的 精确 回答 ， 跟 你 所 用 的 处 理 嚣 和 编译 器 有 关 。 如 果 必 须知 
道 ， 你 就 得 小 心地 给 程序 计时 。 通 常 ， 差 别 是 很 小 的 ， 小 到 要 经 过 数 十 万 次 从 代 
才能 看 到 不 同 [11。 如 果 可 能 ， 查 看 编译 器 的 汇编 输出 ， 看 看 这 两 种 方法 是 否 被 编 


一 般 的 机 器 , “SEA AAR, HE Ee eR, (Ee ARE Wh 
器 却 相 反 。《 好 的 编译 器 无 论 你 使 用 哪 种 方式 都 会 生成 高 效 的 代码 。) 

函数 调用 ， 虽 然 明 显 比 内 联 代 码 要 慢 ， 但 是 基于 它 对 程序 模块 化 和 代码 清晰 
度 的 贡献 ， 很 少 有 好 的 理由 来 避免 它 。《〈 实 际 上 ， 由 于 减 小 了 体积 ， 函 数 甚至 能 
够 提供 效率 。) 同时 ， 有 的 编译 器 可 以 根据 优化 或 程序 员 的 请 求 在 线 扩展 小 的 关 
键 路 径 函 数 。 

在 修整 像 i=i+1 这 样 的 代码 前 ， 记 住 你 是 在 跟 编 译 器 打交道 ， 而 不 是 键 击 编程 
的 计算 器 。 对 于 ++i、i+=1 和 i=i+1， 任 何 好 的 编译 器 都 会 生成 完全 一 样 的 代码 。 
使 用 任何 一 种 形式 只 跟风 格 有 关 ， 与 效 紊 无关。 参见 问题 3.14。 


20.16 


问 : 用 移 位 操作 符 蔡 换 来 法 和 除法 是 否 有 价值 ? 

答 : 这 是 一 个 潜在 危险 且 通 常 不 必 的 优化 的 绝 佳 例子 。 任 何 名 副 其 实 的 编译 
器 都 能 够 用 左 移 代 替 常 数 与 2 的 乘 寡 的 乘法 或 者 用 右 移 代替 类 似 的 除法 。 (Ritchie 
原来 的 PDP-11 编 译 器 ， 尽 管 运行 在 64K 内 存 之 内 而 且 也 省 略 了 现在 的 某 些 必要 功 
能 ， 也 可 以 完成 这 两 种 优化 ， 甚 至 都 不 要 打开 优化 选项 。) 而 且 ， 编 译 器 只 有 在 
它们 正确 的 时 候 才 进行 这 些 优化 。 很 多 程序 员 忽视 了 右 移 负数 和 除法 并 不 等 价 这 
一 事实 。《〈 因 此 ， 如 果 你 必须 进行 这 样 的 优化 ， 一 定 要 确保 相关 的 变量 为 


unsigned. ) 


20.17 


H: 人 们 说 编译 器 优化 得 很 好 ， 我 们 不 再 需要 为 速度 而 写 汇 编 了 ， 但 我 的 编 
译 器 连用 移 位 代替 i/=2 都 做 不 到 。 

答 : 十 有 符号 还 是 无 符号 ? 如 果 是 有 符号 ， 移 位 并 不 等 价 〈 提 示 : 想 想 如 果 
i 是 个 负 的 奇数 ) ， 所 以 编译 器 没有 使 用 是 对 的 。 


20.18 


问 : 怎样 不 用 临时 变量 而 交换 两 个 值 ? 

答 : 一 个 标准 而 古老 的 汇编 程序 员 的 技巧 是 : 

a =b; 

b =a; 

a =b; 

但 是 这 样 的 代码 在 现代 高 级 程序 设计 语言 中 没什么 用 处 。 临 时 变量 基本 上 是 
自由 使 用 的 ， 使 用 3 次 赋值 的 惯用 代码 如 下 : 


int t=a; 


a=b; 

b=t; 

这 不 只 对 读者 更 清晰 ， 更 有 可 能 被 编译 器 辨别 出 来 而 变 成 最 有 效 的 代码 〈 例 
如 有 可 能 使 用 EXCH 指 令 ) 。 后 面 的 代码 明显 可 以 用 于 指针 和 浮 点 值 ， 而 不 像 
XOR 技 巧 只 能 用 于 整 型 。 

参见 问题 3.4 和 10.3。 


switchi= fJ 


20.19 


le]: switch 语 句 和 if/else 链 哪个 更 高 效 ? 

答 : 即使 有 差别 ， 可 能 也 很 小 。switch 语 句 设 计 成 可 以 高 效 实现 ， 但 如 果 case 
行 标 分 布 稀疏 ， 编 译 器 也 可 能 使 用 等 价 的 ipelse 链 《与 紧凑 的 跳 转 表 相 对 ) 。 

只 要 可 能 ， 尺 量 使 用 switch， 它 显然 更 清晰 也 可 能 更 高 效 ( 肯 定 不 会 更 低 
效 ) 。 

参见 问题 20.20 和 20.21。 


20.20 


问 : 是 否 有 根据 字符 串 进行 条 件 切换 的 方法 ? 
BS: 没有 直接 的 方法 。 有 些 时 候 ， 可 以 用 一 个 单独 的 函数 把 字符 串 映射 成 整 
数 代 码 ， 然 后 根据 整数 代码 做 切换 。 
#def ine CODE_APPLE 1 
#def ine CODE ORANGE 2 
#def ine CODE NONE 0 
switch (classifyfunc (string) ) { 
case CODE APPLE: 


case CODE ORANGE: 
case CODE NONE: 


} 
其 中 classifyfunc 函 数 如 下 : 


static struct lookuptab { 
char *string; 
int code; 
} tab[]={ 
{"apple", CODE APPLE }, 
{"orange", CODE ORANGE }, 
E 
classifyfunc (char *str ing) 
{ 
int 1; 
for (i=0; i<sizeof(tab)/ sizeof (tab[0]); i++) 
if (strcmp (tabLi]. string, string )==0) 
return tabLi]. code; 
return CODE _NONE; 
} 
人 否则， 你 当然 也 可 以 使 用 strcmp 和 传统 的 if/else 链 。 
if(strcmp (string, "apple")==0) { 
} else if(strcmp (string, “orange")==0) { 


} 
《使 用 像 问 题 17.3 的 Streq0 那 样 的 宏 会 方便 一 些 。) 
参见 问题 10.12、20.19、20.21 和 20.35。 
参考 资料 : [18, Sec. 3. 4 p. 55] 
[19, Sec. 3.4 p. 58] 
[35, Sec. 3. 6. 4. 2] 
[8, Sec. 6. 6. 4. 2] 
[11, Sec. 8.7 p. 248] 


20.21 


H: 是 否 有 使 用 非常 量 case 行 标的 方法 (如 范围 或 任意 的 表达 式 ) ? 


答 : 没有 。 最 初 设 计 switch 语 句 就 是 为 使 编译 器 能 简单 地 转换 ， 所 以 case 行 标 
被 限制 成 一 个 整 型 常量 表达 式 。 如 果 你 不 介意 详细 地 列 出 所 有 的 情况 ， 可 以 把 几 
个 case 行 标 连 到 同一 个 语句 ， 这 样 你 可 以 覆盖 一 个 小 的 范围 。 
如 果 想 要 根据 任意 范围 或 非常 量 表达 式 进行 选择 ， 你 只 能 用 if/else 链 。 
参见 问题 20.20。 
参考 资料 : [18, Sec. 3. 4 p. 55] 
[19, Sec. 3. 4 p. 58] 
[35, Sec. 3. 6. 4. 2] 
[8, Sec. 6. 6. 4. 2] 
[14, Sec. 3. 6. 4. 2] 
[11, Sec. 8.7 p. 248] 


各 种 语言 功能 


20.22 


问 : return 语 名 外 层 的 括号 是 否 真 的 可 选择 ? 
答 : 是 的 。 
很 入 以 前 ， 在 C 语 言 刚 起 步 的 时 候 ， 它 们 是 必需 的 ， 刚 好 那 时 有 足够 多 的 人 
学 习 了 C， 而 他 们 写 的 代码 如 今 还 在 使 用 ， 所 以 还 是 需要 括号 的 想法 广 为 流 传 。 
碰巧 的 是 ， 在 某 些 情况 下 ，sizeof 操 作 符 的 括号 也 是 可 选 的 。 
参考 资料 : [18, Sec. A18. 3 p. 218] 
[35, Sec. 3. 3. 3, Sec. 3. 6. 6] 
[8, Sec. 6. 3. 3, Sec. 6. 6. 6] 
[11, Sec. 8.9 p. 254] 


20.23 


问 : AA ACH S iz ARB? 怎样 注释 掉 含有 注释 的 代码 ? 引号 包含 
的 字符 串 内 的 注释 是 否 合法 ? 

BS: C 语 言 注 释 不 能 舱 套 最 可 能 的 原因 是 PLA 的 注释 也 不 可 以 ，C 语 言 正 是 借 
鉴 了 它 的 注释 。 所 以 ， 通 常 使 用 丰 fdef 或 贡 f 0 来 “注释 ? 掉 大 段 代 码 ， 其 中 可 能 含 
注释 〈 参 见 问 题 11.21) 。 

字符 序列 #* 和 # 在 双 引 号 内 的 字符 串 中 不 是 特殊 字符 ， 因 此 不 会 导致 注释 ， 
因为 程序 可 能 想 输 出 它们 (特别 是 以 C 源 代码 作为 输出 的 程序 ) 。 (很 难 想象 有 
什么 人 希望 或 需要 在 字符 串 内 部 放 上 注释 ， 而 需要 打印 %/*” 的 程序 却 很 容易 想 
象 。) 

注意 ，// 在 C99 中 才 成 为 合法 的 注释 符 。 

参考 资料 : [18, Sec. A2. 1 p. 179] 

[19, Sec. A2. 2 p. 192] 


[35, Sec. 3.1.9 (esp. footnote 26), Annex E] 
[8, Sec. 6.1.9, Annex F] 

[14, Sec. 3.1.9] 

[11, Sec. 2.2 pp. 18-19] 

[12, Sec. 10 p. 130] 


20.24 


问 : 为 什么 0 语言 的 操作 符 不 设计 得 更 全 面 一 些 ? REAR E, &&= 
和 ->>= 这 样 的 操作 符 。 

答 : 逻辑 异 或 操作 符 〈 假 想 的 “人 ) 可 能 挺 好 ， 但 它 绝 不 能 具有 & &% 和 || 那 样 
的 短路 效应 (参见 问题 3.7) 。 同 样 ， 也 不 清楚 短路 效应 如 何 应 用 到 假想 的 & &= 
和 ||= 操 作 符 。 (也 不 清楚 & &= 和 ||= 操 作 符 到 底 有 多 常用 。) 

尽管 p=p->next 是 个 极其 常见 的 遍历 链表 的 语句 ， 但 -> 却 不 是 二 元 算术 操作 


符 。 因 此 假想 的 ->= 操 作 符 并 不 符合 其 他 赋值 操作 符 的 模式 -就 算 可 以 减少 几 次 
按键 ， 但 它 对 语言 的 清晰 和 完备 并 没有 什么 真正 的 贡献 。 

可 以 用 几 种 方式 写 出 异 或 的 宏 : 

#define XOR(a,b) ((a)&& !(b)|| !(a)&& (b)) /* 1 
*/ 

#define XOR(a,b) (I!!l(a)  !! (bp )) /* 2 
*/ 

#define XOR(a,b) (!! (a) !=!! (b)) /* 3 
*/ 

#define XOR(a,b) (! (a) ~! (b)) /* 4 
*/ 

#define XOR (a,b) (! (a) !=! (b)) /* 5 
*/ 

#define XOR (a,b) ((a)? !(b): !!(b)) /* 6 */ 


iE BOR eI M, (HAR, AAC RAM ENB MS VOR 
值 “ 参 见 问题 10.1) 。 第 二 个 和 第 三 个 通过 对 它们 的 操作 符 两 次 求 反 进行 了 严格 
的 0/1 规 范 化 [2]。 然 后 第 二 个 (对 剩 下 的 唯一 一 位 〉 进 行 按 位 异 或 ， 而 第 三 个 则 


用 != 实 现 了 异 或 。 第 四 个 和 第 五 个 则 基于 基本 的 布尔 运算 等 价 性 ， 即 
a@b=a@b 
《其 中 四 表示 异 或 ， 上 划 线 表示 取 反 ) 。 最 后 ， 第 六 个 由 Lawrence Kirby 和 
Dan ”Pop 提供 ， 使 用 ?: 操作 处 ee ee 
点 。【〔 然 而 ， 还 是 没有 “短路 ”效应 ， 而 且 也 不 可 能 


20.25 


问 : 0 语言 有 循环 移 位 操作 符 吗 ? 

答 : 没有 。〔 部 分 原因 是 C 语 言 的 类 型 大 小 没有 精确 定义 ， 参 见 问题 1.2， 但 
对 已 知 大 小 的 机 器 字 ， 循 环 移 位 很 有 意义 

用 两 个 常规 移 位 和 一 个 按 位 或 操作 就 可 以 实现 循环 移 位 : 

(x<<13)| (x>>3)/* circular shift left 13 in 16 bits */ 


20.26 


问 : C 是 个 伟大 的 语言 还 是 别 的 什么 东西 ? 哪个 其 他 语言 可 以 写 出 像 a++++t+b 
这 样 的 代码 ? 

答 : 在 C 语 言 中 ， 写 成 这 样 也 是 没有 意义 的 。 词 法 分 析 的 规则 是 ， 在 一 个 简 
单 的 从 左 到 右 扫 描 中 的 任何 时 刻 ， 最 长 的 记号 被 划分 ， 不 管 最 终 的 结果 是 否 有 意 
义 。 问 题 中 的 片段 被 解释 为 : 

a+++++b 

这 不 能 被 解析 为 一 个 有 效 的 表达 式 。 

参考 资料 : [18, Sec. A2 p. 179] 
[19, Sec. A2.1 p. 192] 
[8, Sec. 6. 1] 
[11, Sec. 2.3 pp. 19-20] 


20.27 


问 : 如 果 赋 值 操 作 符 是 :=， 是 不 是 就 不 容易 意外 地 写 出 if(a=b) T? 


FENN. {ASA —7 ALE AA UE ES te RL. FCW MAT, D 
在 再 考虑 这 样 的 事情 也 为 时 已 晚 了 。 选 择 = 用 于 赋值 和 == 用 于 比较 的 决定 ， 无 论 
对 错 ， 都 已 经 在 20 多 年 前 完成 了 ， 现 在 也 不 可 能 再 改变 了 。 “关于 这 个 问题 ， 很 
多 编译 器 和 很 多 版 本 的 lint 都 会 对 if(a=b) 这 样 的 代码 提出 警告 。 参 见 问题 17.4。) 

作为 历史 兴趣 ， 做 出 这 样 的 选择 是 基于 赋值 比比 较 更 常用 的 观察 ， 因 而 应 该 
给 它 更 少 的 按键 。 实 际 上 ， 在 C 语 言 和 它 的 前 身 B 语 言 中 用 = 赋值 正 是 从 B 语 言 的 
前 身 BCPL 改 变 而 来 ， 后 者 使 用 了 := 作为 赋值 操作 符 。 (参见 问题 20.44。) 


20.28 


问 : 0 语言 有 和 Pascal 的 with 等 价 的 语句 吗 ? 

答 : 没有 。 在 C 语 言 中 要 快速 而 简单 地 访问 结构 的 成 员 只 需 定义 一 个 小 小 的 
局 部 结构 指针 变量 〈 必 须 承认 ， 它 不 如 with 语句 在 符号 上 方便 ， 而 且 也 不 能 节省 
那么 多 按键 输入 ， 但 是 可 能 会 更 安全 些 ) 。 就 是 说 ， 如 果 你 有 像 这 样 笨拙 的 代 
hg: 


structarray[complex_expression]. a= 


structarray[complex_expression]. b+ 
structarray[complex_expression]. c; 
MRE UR E ERA: 
struct whatever *p=&structarray[complex_expression] ; 


p->a=p->btp->c; 
20.29 


问 : At ACHS RAKE BK? 

SURE BD ve Ff AS, Ee BE WE HW TA) RE ew AA J 
部 变量 ， 为 了 简化 ， 这 个 功能 是 被 故意 舍弃 的 。gcc 的 扩展 功能 允许 函数 藤 套 。 许 
多 可 能 使 用 杠 套 函数 的 地 方 ( 例 如 qsort 比 较 函 数 ) ， 一 个 充分 但 少许 麻烦 的 解决 
方法 是 使 用 一 个 定义 为 静态 〈static) 的 邻近 函数 ， 如 果 需 要 ， 可 以 通过 少量 静态 
变量 进行 通信 。 一 个 更 简洁 的 方法 是 传递 一 个 包含 所 需 内 容 的 结构 指针 ， 虽 然 
qsort 不 支持 这 种 方法 。 


Pl: assert 是 什么 ? 如 何 使 用 ? 
答 : 这 是 个 定义 在 二 asserth> 中 的 宏 ， 用 来 测试 断言 。 一 个 断言 本 质 上 是 写 
下 程序 员 的 假设 ， 如 果 假 设 被 违反 ， 那 表明 有 个 严重 的 程序 错误 。 例 如 ， 一 个 假 
设 只 接受 非 空 指针 的 函数 ， 可 以 写 : 
assert (p !=NULL) ; 
一 个 失败 的 断言 会 中 断 程序 。 断 言 不 应 该 用 来 捕捉 意料 中 的 错误 ， 例 如 
malloc 或 fopen 的 失败 。 
参考 资料 : [19, Sec. B6 pp. 253-254] 
[8, Sec. 7. 2] 
[11, Sec. 19.1 p. 406] 


其 他 语言 


20.31 


问 : 怎样 从 C 中 调用 FORTRAN (C++, BASIC, Pascal, Ada, LISP) 的 函数 ? 
反之 如 何 ? 

答 : 这 完全 依赖 于 机 器 以 及 使 用 的 各 个 编译 器 的 特殊 调用 顺序 ， 有 可 能 完 
做 不 到 。 和 仔细 阅读 编译 器 的 文档 ， 有 些 时 候 有 个 “混合 语言 编程 指南 ”， 但 是 传递 
参数 以 及 保证 正确 的 运行 时 启动 的 技巧 通常 很 星 涩 难 懂 。 

对 于 FORTRAN， 更 多 的 信息 可 以 从 Glenn Geers 的 FORT.gz 找 到 ， 这 个 文档 可 
以 从 匿名 ftp 网 站 suphys.physics.su.0z.au 的 src 目 录取 得 。Burkhard Burow 写 的 头 文 
件 cfortran.h 简 化 了 许多 流行 机 器 上 的 C/IFORTRAN 接 口 。 可 以 从 匿名 ftp 网 站 
zebra.desy.de=Khttp://www-zeus.desy.de/~ burow 4X 44 © 

C++ 中 ， 外 部 函数 说 明 的 "C" 修 饰 符 表 明 函 数 应 该 按 C 的 调用 约定 使 用 。 

参考 资料 : [11, Sec. 4.9.8 pp. 106-107] 


20.32 


问 : 有 什么 程序 可 以 将 Pascal 或 FORTRAN (或 LISP、Ada、awk、“ 老 ”0) 程 


序 转化 为 C 程 序 ? 

答 : 有 几 个 自由 发 布 的 程序 可 以 使 用 : 

p2c 一 一 由 Dave Gillespie 写 的 Pascal 到 C 的 转换 器 ， 发 布 于 新 闻 组 
comp.sources.unix 1990 年 3 月 (第 21 卷 ); 也 可 以 从 


ftp://csvax.cs.caltech.edu/pub/p2c-1.20.tar.Z 取 得 。 
ptoc 一 一 男 外 一 个 Pascal 到 C 的 转换 器 ， 它 是 用 Pascal 写 的 。 
(comp.sources.unix, 310%, 4h] 7ES6134%§) 。 
f2c 一 一 Fortran 到 |C 的 转换 器 ， 由 贝尔 实验 室 、Bellcore ”和 卡 内 基 一 梅 隆 大 学 
的 人 员 共 同 开 发 的 。 可 以 用 以 下 方法 得 到 更 多 的 f2c 信 息 : 发 E-mail 信息 “send 


index from f2c”#lnetlib@research.att.comekresearch!netlib. (在 匿名 ftp 网 站 
netlib.att.com 的 netlib/f2c 目 录 也 可 取得 。) 

本 书 电子 版 FAQ 的 维护 者 还 有 其 他 转换 器 的 列表 。 

参见 问题 11.33 和 18.20。 


20.33 


问 : C++ 是 C 的 超 集 吗 ? 可 以 用 C++ 编译 器 来 编译 C 代 码 吗 ? 

答 : C++ 源 自 C， 而 且 大 部 分 都 建立 在 C 的 基础 上 ， 但 是 有 一 些 合法 的 C 代 码 
在 C++ 中 并 不 合法 。 相 反 地 ，ANSI C 继 承 了 C++ 的 几 个 特性 ， 包 括 原型 和 常量 ， 
所 以 这 两 个 语言 并 非 一 个 是 另 一 个 的 超 集 或 子 集 。 

C++ 有 具有 而 C 没 有 的 最 重要 的 功能 当然 是 扩展 的 结构 ， 即 类 〈class) 。 它 和 操 
作 符 重 载 一 起 令 面 向 对 象 的 编程 十 分 方便 。C++ 还 有 其 他 一 些 差 别 和 新 功能 : 变 
量 可 以 在 块 中 任何 位 置 声 明 ，const 变 量 可 以 成 为 真正 的 编译 时 常量 ， 结 构 标 签 自 
动 进行 类 型 定义 〈typedef) ， 参 数 声 明 中 用 区 表示 按 引 用 传递 ，new 和 delete 操 作 
符 跟 每 个 对 象 的 构造 函数 和 析 构 函数 简化 了 动态 数据 结构 的 管理 。 类 和 面向 对 象 
编程 引入 一 系列 的 新 机 制 : 重 载 、 友 元 、 虚 函数 、 模 板 等 。〈 这 个 C++ 的 功能 列 
表 并 不 完整 ，C++ 程 序 员 会 发 现 很 多 遗漏 。) 

让 C 语 言 免 于 成 为 C++ 的 严格 子 集 〈 即 C 程 序 在 C++ 编译 器 下 不 一 定 能 编译 ) 
的 一 些 功能 包括 main 函 数 可 以 递归 调用 、 字 符 常 量 类 型 为 int、 不 要 求 原 型 以 及 
void * 可 以 隐 式 转换 为 其 他 指针 类 型 。 而 且 不 是 C 语 言 关键 字 的 任何 C++ 关 键 字 都 
可 以 在 C 语 言 中 用 作 标 识 符 ， 因 此 使 用 class 和 friend 这 样 的 标识 符 的 C 程 序 会 被 
C++ 编译 器 拒绝 。 

尽管 有 这 些 不 同 ， 许 多 C 程 序 在 C++ 环境 中 可 以 正确 编译 ， 许 多 最 新 的 编译 
器 同时 提供 C 和 C++ 的 编译 模式 。 

参考 资料 : [11,p.xviii, Sec.1.1.5 p.6,Sec.2.8 pp. 36-37,Sec. 4.9 
pp. 104-107] 


20.34 


H: 我 需要 用 到 “近似 ”的 strcmp 例 程 ， 比 较 两 个 字符 串 的 近似 度 ， 并 不 需 


要 完全 一 样 。 有 什么 好 办 法 ? 

答 : Sun Wu 和 Udi Manber 的 文章 *AGREP - A Fast Approximate Pattern- 
Matching Tool”[34] 中 有 一 些 有 用 的 信息 ， 近 似 字 符 串 匹配 的 算法 以 及 有 用 的 参考 
文献 。 

另外 一 个 方法 牵涉 到 “soundex” 算 法 ， 它 把 发 音 相近 的 词 映 射 到 同一 个 代码 。 
它 是 为 发 现 近 似 发 音 的 名 字 而 设计 的 《作为 电话 号 码 目 录 的 帮助 ) ， 但 是 它 可 以 
调整 用 于 任意 词 处 理 的 服务 。 

参考 资料 : [21, Sec. 6 pp. 391-392 Volume 3] 

[34] 


问 : 什么 是 散 列 法 ? 
答 : 散 列 法 是 把 字符 串 映 射 到 整数 的 处 理 ， 通 常 是 到 一 个 相对 小 的 范围 。 一 
个 “ 散 列 函数 ”映射 一 个 字符 串 (或 其 他 的 数据 结构 〉 到 一 个 有 界 的 数字 〔 散 列 
桶 〉 ， 这 个 数字 可 以 更 容易 地 用 于 数组 的 索引 或 者 进行 反复 的 比较 。 显 然 ， 一 个 
从 潜在 的 有 很 多 组 的 字符 串 到 小 范围 整数 的 映射 不 是 唯一 的 。 任 何 使 用 散 列 的 算 
法 都 要 处 理 “ 冲 突 * 的 可 能 。 
已 经 开发 出 了 许多 散 列 函数 和 相关 的 算法 。 全 面 的 讨论 经 超出 了 本 书 的 范 
围 。 一 个 简单 的 对 字符 串 进行 操作 的 散 列 函数 仅仅 将 所 有 的 字符 值 加 起 来 : 
unsigned hash (char *str) 
unsigned int h=0; 
while(*str !='\0') 
h+=*str++; 


return h % NBUCKETS; 


} 

下 面 是 一 个 更 好 点 儿 的 散 列 函数 : 

unsigned hash (char *str) 
unsigned int h=0; 


while (*str !='\0') 
h=(256 * h+*str++)% NBUCKETS; 
return h; 
} 
这 里 把 输入 串 看 作 一 个 很 大 的 二 进 制 数 (假设 每 字 节 8 位 ，8 * strlen(str) 位 
长 〉》， 然 后 用 Homer 法 则 计算 这 个 数 对 NBUCKETS 的 模 。 (这 里 很 重要 的 是 
NBUCKETS 必 须 为 素数 。 要 去 掉 字 符 为 8 位 的 假设 ， 需 要 用 UCHAR_MAX+1 代 替 
256， 这 时 这 个 “大 二 进 制 数 ” 就 变 成 CHAR_BIT * strlen(str)iZtk T - 
UCHAR_MAXICHAR_BITË <limith> He XM. ) 如果 字符 串 集 可 以 预知 ， 那 
么 也 可 以 设计 出 没有 “冲突 ?>、 秽 密 映 射 的 “完美 ” 散 列 函数 。 
参考 资料 : [19, Sec. 6. 6] 
[21, Sec. 6.4 pp. 506-549 Volume 3] 
[31, Sec. 16 pp. 231-244] 


20.36 


问 : 如 何 生成 正 态 或 高 斯 分 布 的 随机 数 ? 
答 : 参见 问题 13.20。 


| 


20.37 


问 : 如 何 知道 某 个 日 期 是 星期 几 ? 

答 ; 有 以 下 3 种 方法 。 

(1) 用 mktime 或 localtime。 这 是 一 个 计算 2000 年 2 月 2 日 为 星期 几 的 代码 段 : 

#include<stdio. h> 

#include<time. h> 

char *wday[]={"Sunday", "Monday", "Tuesday", "Wednesday", 
"Thursday", "Friday", "Saturday"} ; 

struct tm tm; 

tm. tm mon=2 — 1; 


tm. tm mday=29; 


tm. tm_year=2000 - 1900; 
tm. tm_hour=tm. tm_min=tm. tm_sec=0; 
tm. tm_isdst=-1; 
if (mkt ime (& tm) !=-1) 
printf ("%s\n", wday [tm. tm _wday]) ; 
像 这 样 使 用 mktime 的 时 候 ， 一 定 要 将 tm_isdst 设 为 -1〈 尤 其 是 当 tm_hour 为 0 的 
时 候 ) ; 否则， 夏令 时 修正 会 将 超过 午夜 的 时 间 放 到 另 一 天 。 
(2) 使 用 Zeller 同 余 演 算式 。 它 表明 如 果 
J 是 世纪 数 ( 即 年 份 /100) , 
K 是 世纪 内 的 年 数 〈 即 年 份 %100) ， 
m 是 月 份 ， 
gq 是 月 内 的 天 数 ， 
h 是 星期 几 (其 中 星期 天 为 1) ， 
而 且 一 月 和 二 月 被 看 作 上 一 年 的 第 13 和 14 个 月 《同时 影响 J 和 K) ， 对 于 格雷 
果 里 历 ，h 就 是 
q+26(m+1)/10+K+K/4+J/4-2J 
被 7 除 的 余数 ， 其 中 所 有 的 中 间 余 数 都 被 扔 掉 。[3] 翻 译 成 C 语 言 简单 明了 : 
h=(q+26 * (m+1)/ 10+K+K/4+J/4+5*J)% 7; 
《这 里 使 用 +5*J 代 蔡 -2 呈 是 为 了 确保 求 模 操作 符 % 两 边 都 是 正 数 。 显 然 求 和 
的 7*J 偏 移 量 并 不 影响 对 7 去 模 的 结果 。) 
(3) 使 用 这 段 由 Tomohiko Sakamoto 提 供 的 简洁 的 代码 : 
int dayofweek (int y, int m, int d)/* 0=Sunday */ 
{ 
static int t[]={0, 3, 2,5, 0, 3,5, 1, 4, 6, 2, 4}; 
y -=m<3; 
return (yty/4 — y/100+y/400+t [m-1]+d) %7; 


} 

参见 问题 13.14 和 20.38。 

参考 资料 : [35, Sec. 4. 12. 2. 3] 
[8, Sec. 7. 12. 2. 3] 


[36] 


20.38 


问 : (year % 4==0) 是 否 足 以 判断 关 年 ? 2000 年 是 半年 吗 ? 

答 : 这 个 测试 并 不 足够 〈2000 年 是 国 年 ) 。 对 于 当前 用 的 格雷 果 里 历法 ， 国 
年 每 4 年 出 现 一 次 ， 而 不 是 每 100 年 出 现 一 次 ， 不 过 它 每 400 年 都 会 出 现 。 这 个 规 
则 的 完整 表达 如 下 : 

year % 4==0 && ( year % 100 !=0 || year % 400==0) 

详情 请 参阅 一 本 好 的 天 文 历 法 的 书 或 其 他 参考 资料 。 那 些 主张 还 有 一 个 4000 
年 规则 的 参考 资料 是 错 的 。 参 见 问题 13.14。 

如 果 你 信任 C 库 的 实现 ， 可 以 用 mktime 判 断 给 定 的 年 份 是 否 为 头 年 。 参 见 问 
题 13.14 和 20.37 中 的 代码 片段 。 

事实 上 ， 如 果 感 兴趣 的 范围 有 限 〈 或 许 源 于 某 个 time_t 型 变量 的 范围 限 
制 ) ， 以 致 它 所 包围 的 唯一 一 个 世纪 年 就 是 2000 的 时 使 ， 表 达 式 

(year % 4==0) / 1901-2099 only */ 

是 准确 的 ， 虽 然 不 那么 健壮 。 

注意 ， 从 儒 略 历 到 格雷 果 里 历 的 转换 为 补偿 累积 的 错误 而 删 掉 了 几 天 。 OX 
个 转换 最 初 于 1582 年 10 月 在 教 星 格雷 果 里 十 三 世 统 治 的 天 主教 国家 进行 ， 删 除了 
10 天 。1752 年 9 月 英 帝 国 采纳 格雷 果 里 历 的 时 候 删 除 11 天 。 有 些 国家 直到 20 世 纪 
才 进 行 转换 。) 那些 应 付 历史 日 期 的 代码 因此 尤其 需要 注意 。 


20.39 


Pl: 为 什么 tm 结构 中 的 tm_sec 的 范围 是 0 到 61， 了 瞳 示 一 分 钟 有 62 秒 ? 

答 : 那 实际 是 标准 中 的 一 个 小 bug。 国 秒 的 时 候 一 分 钟 的确 可 能 有 61 秒 。 一 
年 最 多 可 以 有 2 个 羡 秒 ,但 是 可 以 确保 它们 绝 不 会 在 同一 天 出 现 ( 更 别 说 同一 分 
钟 了 ) 。 


问 : 一 个 难题 : 怎样 写 一 个 输出 自己 源 代码 的 程序 ? 


答 : 要 写 一 个 可 移植 的 自我 再 生 的 程序 是 件 很 困难 的 事 ， 部 分 原因 是 因为 引 
用 和 字符 集 问题 。 这 里 是 个 经 典 的 例子 〈 应 该 以 一 行 表示 的 ， 但 是 第 一 次 执行 后 


它 会 自我 修复 ) : 

char*s="char*s=%ce%s%c; main() {printf (s, 34, s, 34) ;}"; 

main() {printf (s, 34, s, 34) ;} 

这 段 程 序 有 一 些 依赖 性 ， 它 忽略 了 贡 nclude<stdio.h> 之 ， 还 假设 了 双 引 号 "的 
值 为 4， 和 ASCII 中 的 值 一样 。 

这 里 还 有 一 个 有 James Hu 发 布 的 改进 版 : 

#define q(k)main( {return! puts (#k"\nq ("#k") ") ;} 

q(#define q(k)main() {return! puts (#k"\ng ("#k") ") ;}) 


20.41 


Ml: 什么 是 “ 达 夫 设备 ” (Duff 's Device) ? 

SB: 这 是 个 和 cd E di 由 Tom Duff 在 Lucasfilm 时 设计 。 它 
的 “传统 ”形态 是 用 来 复制 多 个 字 

register n=(count+7)/ 1 /* count>0 assumed */switch (count % 8) 

{ 


case 0: do { *to=*from++; 

case 7 *to=*f romt+; 
case 6: *to=*fromt+; 
case 5 *to=*f romt+; 
case 4 *to=*f romt+; 


case 3: *to=*fromtt ; 
case 2: *to=*fromtt; 
case 1: *to=*fromt+; 


} while (--n>0); 


这 里 count 个 字 节 从 from 指 向 的 数组 复制 到 to 指向 的 内 存 地 址 (这 是 个 内 存 映 
射 的 输出 寄存 器 ， 这 也 是 为 什么 它 没 有 被 增加 〉 。 它 把 swtich 语 句 和 复制 8 个 字 节 
的 循环 交织 在 一 起 ， 从 而 解决 了 剩余 字 布 的 处 理 问 题 〈 当 count 不 是 8 的 倍数 
时 ) 。 信 不 信 由 你 ， 像 这 样 的 把 case 标 志 放 在 藤 套 在 swtich 语 句 内 的 模块 中 是 合法 
的 。 当 他 向 C 的 开发 者 和 世界 公布 这 个 技巧 时 ，Duff 注 意 到 C 的 swtich 语 法 ， 特 别 
是 “跌落 ”行为 ， 一 直 是 备 受 争议 的 ， 而 “这 段 代码 在 争论 中 形成 了 某 种 论据 ， 但 我 


不 清楚 是 赞成 还 是 反对 ”。 


20.42 


问 : FAAR E ALARA (International Obfuscated © Code 
Contest, 10CCC) 什么 时 候 进行 ? 哪里 可 以 找到 当前 和 以 前 的 获胜 代码 ? 

答 : 竞赛 的 时 间 表 随 着 时 间 而 变化 ， 当 前 详情 请 参考 
http://www.ioccc.org/index.html 。 

竞赛 的 优胜 者 通常 在 Usenix 会 议 上 公布 ， 结 果 会 在 上 晚 些 时候 公 布 在 网 上 。 前 
几 年 〈 追 溯 到 1984 年 ) 的 获胜 代码 在 ftp.uu.net 有 档案 〈 人 参见 问题 18.20) ， 在 目录 
puby/ioccc/ 下 ， 参 阅 http:/www.ioccc.org/index.html。 


20.43 


Pl: K&R1 提 到 的 关键 字 entry 是 什么 ? 

答 : 它 是 保留 起 来 允许 某 些 函数 有 多 个 不 同名 字 的 进入 点 ， 就 像 FORTRAN 
那样 。 众 所 周 之 ， 它 从 没 被 实现 过 (也 没 人 记得 为 它 设 想 的 语法 是 怎样 的 ) 。 它 
被 丢弃 了 ， 它 也 不 是 ANSI C 的 关键 字 。 参 见 问题 1.12。 

参考 资料 : [19, p.259 Appendix C] 


20.44 


问 : C 的 名 字 从 何 而 来 ? 

答 : C 源 自 Ken Thompson 的 实验 性 语言 B， 而 B 由 Martin Richards 的 
BCPL (Basic Combined Programming Language) 得 到 灵感 ， 而 BCPL 是 
CPL (Combined Programming Language 或 也 许 是 Cambridge Programming 
Language) 的 简化 版 。 有 一 段 时 间 ， 人 们 猜测 C 的 后 继 者 会 命名 为 P〈BCPL 的 第 
三 个 字母 ) 而 不 是 D， 当 然 ， 如 今 最 显 见 的 后 裔 语言 是 C++。 

参考 资料 : [37] 


问 : “char ”如 何 发 音 ? 
答 : C 关 健 字 “char”" 至 少 有 3 种 发 音 : 像 英文 词 “char”、 “care” 或 “car” (又 或 
者 “character”) ， 你 可 以 任 选 一 个 。 


20.46 


问 : “lvalue” #2 “rvalue” RAH ABS? 

答 : 简单 地 说 ,，“lvalue” 是 个 可 以 出 现在 赋值 语句 左 方 的 表达 式 ， 也 可 以 把 它 
想象 成 有 地 址 的 对 象 。 有 关 数 组 的 ， 参 见 问题 6.7。“rvalue” 就 是 有 值 的 表达 式 ， 
所 以 可 以 用 在 赋值 语句 的 右 方 。 


20.47 


问 : 哪里 可 以 获得 本 书 的 在 线 版 ? 

答 : 本 书 是 新 闻 组 comp.lang.c 的 FAQ 列 表 的 扩展 版 ， 它 的 英文 在 线 厂 的 网 址 
是 http://www.eskimo.com/~scs/C-faq/top.html. ~^ EX 4H. SAMA Usenet 
FAQ 的 网 站 是 http:/www.faqs.org/faqs/。 本 书 的 勘误 表 在 http:/www.eskimo.comy/ 一 
scs/C-faq/book/Errata.html VA Æ ftp://ftp.eskimo.com/u/s/scs/ftp/C-faq/book/Errata_E.. 


(LW EES, EER AR RAC IRE. 


已. 如 果 XOR 宏 要 模拟 C 语 言 其 他 的 布尔 操作 符 ， 即 根据 是 否 非 零 对 操作 数 的 真 / 
假 进行 解释 ， 那 么 规范 化 就 很 重要 了 (参见 问题 9.2) 。 


[31Zeller 同 余 演算 式 至 少 有 一 种 修改 形式 被 广泛 传播 ， 这 里 的 公式 是 原始 的 形 


To 


术语 表 


这 些 是 本 书 中 使 用 到 的 术语 的 定义 。 有 些 术语 有 更 正式 、 稍 微 不 同 的 定义 。 
这 个 术语 表 不 是 权威 的 字典 。 这 里 很 多 的 术语 来 上 自 ANSIISO C 标 准 。 参 见 ANSI 
1.6 节 和 ISO 第 3 章 。 

聚集 (aggregate) 【名 】 数 组 、 结 构 或 联合 类 型 。【 形 】 指 这 样 的 类 型 。 

实 参 (actual argument) 见 参数 (argument) 。 

别名 (alias) 【名 】〔 通 常 以 指针 形式 ) 对 一 个 已 知 通过 其 他 方式 ORE 
本 喘 的 名 称 或 其 他 指针 ) 引用 的 对 象 的 引用 。【 动 】 创 建 这 样 的 引用 。 

ANSI【 名 】 美 国 国家 标准 协会 。【 形 】 非 正式 地 指标 准 C。 参 见 问题 11.1。 

参数 (argument) 【名 】 在 函数 调用 或 函数 式 的 宏 扩展 的 时 候 传 入 参数 列表 
的 值 。 常 党 强调 为 实 参 。 与 参数 (parameter) 比较 。 

argv【 名 】 当 C 程 序 被 调用 时 ， 传 入 main() 的 命令 行 参数 数组 (“向 量 *) 的 传 
统 名 称 。 参 见 问题 11.13 和 20.3。 

算术 的 (arithmetic) 【 形 】 指 可 以 执行 传统 算术 运算 的 类 型 或 值 。C 语 言 中 
的 算术 类 型 是 整数 和 浮 点 类 型 (float、double 和 long double. ) 

ASCII【 名 】【 形 】 美 国信 息 互 换 标准 代码 ，ANSI X3.4-86. 

赋值 上 下 文 Cassignment context) 【名 了】 导致 赋值 或 转换 到 已 知 类 型 的 目标 
的 表达 式 上 下 文 。C 语 言 中 的 赋值 上 下 文 有 初始 式 、 赋 值 表达 式 的 右 侧 、 类 型 转 
换 、retum 语 句 和 缺少 原型 的 函数 参数 。 

自动 的 〈automatic) [Æ] 《通常 用 在 “自动 生存 期 "中 ) 指 在 进入 函数 (或 
RER) 的 时 候 自 动 分 配 存储 并 在 从 函数 返回 《〈 或 从 块 中 退出 ) 的 时 候 自 动 释放 
的 对 象 。 换 言 之 ， 指 局 部 的 非 静 态 变 量 〈 跟 全 局 或 静态 变量 相对 ) 。 比 较 静 态 ， 
意义 1。 人 参见 问题 1.31。 

Km] (big-endian) 【 形 】 指 多 字 节 量 最 高 字 节 在 最 低地 址 的 存储 方式 。 参 
见 字 节 顺序 。 


二 进 制 的 /二 元 的 (binary) 【 形 】1. 以 二 为 基 的 计数 方式 。2. 指 按 字 节 或 按 位 
不 进行 格式 化 或 解释 的 输入 输出 ， 即 内 存 和 外 存 之 间 的 直接 复制 。3. 指 按 原 始 字 
节 流 解释 的 文件 ， 其 中 可 能 出 现任 何 字 节 值 。 与 文本 的 比较 。 参 见 问 题 12.41、 
12.43 和 20.5。4. 指 带 两 个 操作 数 的 操作 符 。 与 一 元 的 比较 。 

Zh (bind) 【 动 】 非 正式 地 结合 在 一 起 ， 通 常用 来 表示 根据 优先 级 规则 ， 
哪些 操作 数 和 哪个 操作 符 结 合 在 一 起 。 

位 掩 码 (bitmask) 【名 】 掩 码 ， 意 义 1。 

字 节 (byte) 【名 】 适 于 保存 一 个 字符 的 存储 单位 。 与 八 位 字 节 (octet) 比 
较 。 参 见 问题 8.10。 参 考 [35,Sec.1.6] 或 [8,Sec.4.6]。 

字 节 顺序 (byte order) 【和 名】 多 字 节 量 (通常 是 整数 ) 在 内 存 、 磁 盘 、 网 络 
或 其 他 字 节 IO 流 中 的 存储 顺序 特征 。 两 种 常见 的 字 节 顺序 〈 高 字 节 在 前 和 低 字 节 
在 前 ) 通常 称 为 大 端 和 小 端 。 

规范 模式 (canonical mode) 【名 】 终 端 驱动 的 模式 ， 这 种 模式 下 ， 输 入 以 行 
为 单位 进行 ， 人 允许 用 户 用 退 格 /删除 / 探 除 键 或 其 他 键 修 正 错误 。 参 见 问 题 19.1。 

.文件 【名 】 源 文件 ， 意 义 2。 (参见 问题 1.7 和 10.6。) 

类 型 转换 【名 】 这 样 的 语法 形式 : 

(type - name) 

其 中 type-name 是 一 个 类 型 名 称 ， 如 int、char * 等 ， 用 来 表示 一 个 值 到 另 一 种 
类 型 的 显 式 转换 。【 动 】 转 换 一 个 值 的 类 型 。 

符合 标准 Cconforming) 【 形 】1. 指 可 以 接受 任何 严格 符合 标准 的 程序 的 实现 

(编译 器 或 其 他 语言 处 理 器 ) 。2. 指 可 以 被 符合 标准 的 实现 接受 的 程序 。 “参见 
[35,Sec.1.7] 和 [8,Sec.4]。 ) cpp【 名 】 实 现 C 预 处 理 器 功能 的 独立 程序 的 传统 名 
称 。 

退化 (decay) 【 动 】 隐 式 转换 为 稍 简 单 的 类 型 的 过 程 。 非 正式 地 ，C 语 言 的 
数组 和 函数 趋 癌 于 退化 为 指针 。 参 见 问 题 1.36 和 6.3。 

声明 (declaration) 【名 】1. 一 般 地 ， 摘 述 一 个 或 多 个 变量 、 函 数 、 结 构 、 联 
合 或 枚 举 的 名 称 和 类 型 的 语法 元 素 。2. 有 具体 地 ， 指 明 在 其 他 地 方 定义 的 变量 或 函 
数 的 声明 。 参 见 问题 1.7。 

声明 符 〈declarator) 【名 】C 语 言 声明 的 “第 二 半 ”， 包 含 标识 符 名 称 和 可 选 
的 *、 口 或 0 语法 ， 该 语法 (如果 存 在 〉 表 明 标 识 符 是 指针 、 数 组 、 函 数 或 其 他 组 


合 。 参 见 问题 1.21。 

定义 〈definition) 【名 】1. 变 量 或 函数 分 配 和 可 选 地 初始 化 存储 (变量 的 情 
况 ) 或 提供 函数 体 〈 函 数 的 情况 ) 的 声明 。 这 种 意义 下 的 定义 跟 声明 的 意义 2 相 
反 。 参 见 问 题 1.7。2. 结 构 、 联 合 或 枚 举 类 型 描述 类 型 〈 并 通常 分 配 标签 ) 而 不 一 
定 定 义 该 类 型 的 任何 变量 的 声明 。3.#define 预 处 理 指 令 。 

解 引 用 (dereference) 【 动 】 和 碍 找 被 引用 的 值 。 通 常 , “被 引用 的 值 ?是 指针 
指向 的 值 ， 因 此 “ 解 引用 ?就 是 指 找 出 指针 所 指 何 物 〈 在 C 语 言 中 ， 用 一 元 操作 符 * 
或 数组 下 标 操作 符 []) 。 偶 尔 也 指 取 任何 变量 的 值 。 参 见 间接 。 

内 情 癌 量 (dope vector) 【名 】 仅 包含 指向 其 他 数组 〈 或 指针 模拟 数组 ) 的 
虽 针 的 数组 〈 或 指针 模拟 数组 ) 。 参 见 不 规 则 数组 。 参 见 问题 6.17 和 20.2。 

外 部 Cexternal) 【名 】 在 一 个 源 文件 (或 目标 模块 ， 中 引用 但 却 没 有 定义 的 
函数 或 变量 。 通 常 出 现在 连接 器 不 能 找到 定义 时 输出 的 错误 信息 “undefined 
external” 中 。 

域 (field) 【名 】1. 结 构 或 联合 的 成 员 。〔 无 上 疏 义 的 术语 是 成 员 
(member) . ) 2. 具 体 地 指 位 域 。 参 见 问 题 2.26。 

形 参 (formal parameter) 参见 参数 (parameter) 。 

独立 环境 (freestanding environment) 【名 】1. 不 支持 C 库 的 C 语 言 环境 ， 用 于 
先入 应 用 或 类 似 目 的 。 与 宿主 环境 比较 。 (参见 [35,Sec.1.7] 或 [8,Sec.4]。) 

FSF [Æ ] Free Software Foundation， 自 由 软件 基金 会 。 

FTP 1.【 名 】 因 特 网 文件 传输 协议 。2.【 动 】 用 FTP 传 输 文件 。 

完整 表达 式 (full expression) 【名 】 形 成 表达 式 语句 的 完整 表达 式 ，if、 
switch、while、for 或 do/while 语 句 的 控制 表达 式 之 一 ， 或 者 初始 式 或 return 语 句 中 
的 表达 式 。 完 整 表达 式 不 是 更 大 的 表达 式 的 一 部 分 。“《〈 人 参见 [35,Sec.3.6] 或 
[8,Sec.6.6]) 。 

函数 指针 (function pointer) 【名 】 任 何 函 数 类 型 的 指针 。 与 对 象 指针 比较 。 

gcc【 名 】FSF 的 GNU C 编 译 器 。 

GNU【 名 】FSF 的 “GNU’s Not UNIX” ji H o 

.hh 文件 【名 】 尖 文件 。 

头 文件 Cheader file) 【名 】 包 含 声 明和 某 些 定义 但 不 包括 函数 体 或 全 局 变量 
定义 的 文件 ， 在 预 处 理 的 时 候 通 过 #include 并 入 编译 单位 。 与 源 文件 比较 。 参 见 问 


7110.6. 

H&S Samuel P.Harbison 和 Guy L.Steele,Jr34fJC:A Reference Manual 〈 参 见 文 
献 中 的 完整 引用 ) 。 

宿主 环境 Chosted environment) 【名 】 文 持 C 库 的 C 语 言 环 境 。 与 独立 环境 比 
较 。 (参见 [35,Sec.1.7] 和 [8,Sec.4]。) 

REA Cidempotent) 【 形 】 严 格 执行 一 次 的 ， 如 果 重 用 也 无 伤 大 雅 的 。 在 C 
语言 中 ， 通 常 指头 文件 。 参 见 问题 10.7 和 11.23。 

标识 符 (identifier) 【名 】 通 常 在 特定 命名 空间 和 作用 域 中 有 特定 意义 的 名 
称 。 参 见 问题 1.30。 

实现 (implementation) 【名 】 编 译 器 或 其 他 语言 翻译 器 ， 包 括 它 的 运行 库 。 
用 在 “普通 的 char 是 有 符号 还 是 无 符号 值 由 实现 定义 ”和 “这 些 标识 符 由 实现 保 
留 ” 这 样 的 语句 中 。 

实现 定义 的 (implementation-defined) 【 形 】 指 那些 标准 没有 完全 定义 ， 但 
要 求 任何 特定 的 实现 都 必须 定义 、 提 供 文档 的 行为 。 例 如 : 普通 的 char 是 有 符号 
还 是 无 符号 值 由 实现 定义 。 参 见 问题 11.35。 

外 nclude 文 件 【名 】 头 文件 。 

不 完全 类 型 (incomplete type) 【名 】 没 有 完全 说 明 但 在 某 种 上 下 文中 还 是 可 
以 使 用 的 类 型 。 例 如 : 无 维度 数组 、 有 标记 符 但 没有 成 员 信息 的 结构 或 联合 类 
型 。 (参见 [35,Sec.3.1.2.5] 或 [8,Sec.6.1.2.5]。) 

in-band【 形 】 指 哨兵 标记 值 在 它 出 现 的 地 方 的 取 值 集合 中 并 不 唯一 。 与 out- 
of-band 比 较 。 例 如 : CP/M 或 MS-DOS 的 control-Z 文 件 末尾 标志 。 参 见 问题 12.43。 

间接 Cindirect) 【 动 】 实 施 一 级 间接 。 例 如 , “在 指针 上 间接 ”表示 查找 指针 
指向 的 值 ( 与 仅仅 发 现 指 针 的 值 相对 ) 。 参 见解 引用 。 

int【 名 】 整 数 类 型 ， 通 常 和 机 器 的 自然 字 长 匹配 ， 通 常用 来 (有 时 默认 就 ) 
代表 C 语 言 中 的 整数 。 

整数 (integer) 【名 】 某 种 大 小 的 整数 〈short 或 1ong) ， 不 一 定 是 普通 的 
int。 

整 型 Cintegral) 【 形 】 指 可 以 代表 整数 的 类 型 。C 语 言 中 的 整 型 是 char 型 、 三 
种 大 小 的 int 型 〈short、 普 通 和 long 型 ) 、 上 述 类 型 的 signed 和 unsigned 变 体 及 极 


ISO【 名 】 国 际 标准 化 组 织 (The Intemational Organization of Standardization 
或 Organisation Internationale de Normalisation) 。 

K&R【 名 】 1. 书 The C Programming Language (完整 引用 见 文献 )。2. 该 书 
的 作者 Brian Kernighan 和 Dennis Ritchie。【 形 】 指 该 书 第 一 版 K&R1) 所 描述 
的 早期 C 语 言 版 本 。 

lhs【 名 】 通 常 值 赋值 的 左手 边 ， 或 者 更 一 般 地 指 任何 二 元 操作 符 的 左手 边 。 

lint [Æ 】Steve Johnson 编 写 的 一 个 程序 与 他 的 pcc 配 套 使 用 ， 用 于 执行 C 语 言 
编译 器 通常 不 执行 的 路 文件 和 其 他 错误 检查 。 据 推测 ， 该 名 称 源 于 fluff〈 错 
W) [11。【 动 】 用 lint 检 查 程 序 。 

小 端的 Clittle-endian) 【 形 】 指 多 字 节 量 最 低 字 节 在 最 低地 址 的 存储 方式 。 
参见 字 节 顺序 。 

A (value) 【名 】 本 指 能 出 现在 赋值 操作 符 左 侧 的 表达 式 亦 即 可 以 被 赋值 
的 东西 。 更 严格 地 讲 是 指 有 位 置 的 事物 ， 跟 过 渡 值 相对 。 在 赋值 a=b; 中 ，a 是 左 
值 ， 没 有 被 取出 而 是 被 赋值 。 与 右 值 (rvalue〉 比 较 。 参 见 问 题 6.8。 参 考 
[35,Sec.3.2.2.1 (尤其 是 脚注 1〉] 或 [8,Sec.6.2.2.1]。 

mask ”1.【 名 】 特 别 作 为 1 和 0 的 组 合 解释 用 于 执行 位 操作 (及 、| 等 ) 的 整数 
值 。2.【 动 】 用 掩 码 (意义 1) 和 位 操作 符 选择 特定 位 。 参 见 问题 20.7。 

成 员 (member) 【名 】 结 构 或 联合 有 类 型 的 组 成 部 分 之 一 。 

命名 空间 (namespace) 【名 】 可 以 在 其 中 定义 名 称 〈 标 识 符 ) 的 上 下 文 。C 
语言 中 有 几 种 命名 空间 ， 例 如 普通 变量 可 以 和 结构 标签 同名 而 不 会 导致 模糊 不 
清 。 参 见 问 题 1.30。 

ZHI (narrow) 【 形 】 指 通过 默认 参数 提升 放大 的 类 型 : char、short 或 float。 
参见 问题 11.4 和 15.2。 

不 可 再 入 的 Cnonreentrant) 【 形 】 指 使 用 静态 内 存 或 暂时 将 全 局 变量 置 于 不 
一 致 的 状态 的 代码 ， 以 至 于 当 它 自己 的 另 一 个 实例 处 于 活动 状态 时 不 能 再 次 被 调 
用 。〔 亦 即 它 不 能 被 中 断 处 理 器 调用 ， 因 为 被 中 断 的 可 能 就 是 它 本 映 。) 

“notreached”【 插 入 语 】lint 或 其 他 程序 检查 器 中 的 指令 ， 表 明 控制 流 不 能 到 
达 某 处 ,而 某 些 警 告 〈 如 “control falls out of function without return”) 因此 应 该 被 关 
fii 

空 指针 (null pointer) 【和 名】 不 是 任何 对 象 或 函数 的 地 址 的 特殊 指针 值 。 参 


见 问 题 5.1。 

空 指针 销量 (null pointer constant) 【名 】 值 为 0 的 整 型 常数 表达 式 〈 或 转换 
Avoid * 的 那样 的 表达 式 ) ， 用 于 请 求 一 个 空 指针 。 人 参见 问题 5.2。 

O(n)【 形 】 表 示 算 法 的 “ 阶 ” 或 可 计算 的 复杂 性 的 符号 。O(n) 的 算法 消耗 的 时 
间 和 操作 的 对 象 的 数量 成 正比 。O(n”) 的 算法 消耗 的 时 间 和 操作 的 对 象 的 数量 的 平 
方 成 正比 。 依 此 类 推 。 

WA Cobject) 【名 】 可 以 被 C 程 序 操作 的 任何 数据 块 : 简单 变量 、 数 组 、 结 
构 、malloc 分 配 的 内 存 块 等 。 参 见 对 象 指针 。 

WARE Cobject pointer) 【和 名】 任何 对 象 或 不 完全 类 型 的 指针 。 与 函数 指 
针 比 较 。 

八 位 字 节 (octet) 【名 】8 位 的 数量 。 参 见 字 节 (byte) 。 

不 透明 的 Copaque) 【 形 】 形 容 意 在 成 为 抽象 数据 的 数据 类 型 : 使 用 该 类 型 
的 代码 不 应 该 知道 该 类 型 如 何 实现 《〈 它 是 一 个 简单 类 型 还 是 结构 ， 如 果 是 结构 又 
包含 哪些 域 ) 。 参 见 问题 2.4。 

求 值 顺序 Corder of evaluation) 【名 】 表 达 式 包含 的 运算 被 处 理 器 执行 的 真 
实 顺 序 。 与 优先 级 比较 。 参 见 问题 3.5。 

参数 (parameter) 【名 】 男 数 定义 、 函 数 式 宏 定 义 或 图 数 原 型 声明 中 用 来 代 
表 将 要 传 入 的 实际 参数 的 标识 符 。 通 常 强 调 为 “形式 参数 ”"。 与 参数 (argument) 
比较 。 在 代码 

main() 

{ 

f (5) ; 
return 0; 

} 

f(int i) 

{ 

} 

中 ，f 的 形式 参数 是 i， 而 实际 参数 是 5。 在 片段 

extern int g(int apple); 


int orange=5; 


g (orange) ; 

中 ，g 的 形式 参数 是 apple， 实 际 参数 是 orange。 

按 引 用 传递 (pass by reference) 【和 名】 一 种 参数 传递 机 制 ， 函 数 接收 实际 参 
数 的 引用 ， 如 果 函 数 修改 它 ， 则 调用 函数 中 的 值 也 被 修改 。C 语 言 中 没有 提供 
《参见 问题 4.11) 。 

按 值 传递 (pass by value) 【和 名】 一 种 参数 传递 机 制 ， 函 数 接收 实际 参数 的 副 
本 ， 如 果 函 数 修改 它 ， 则 只 修改 它 自己 的 副本 〈 不 会 影响 调用 函数 中 的 值 ) 。C 
语言 中 总 是 采用 。 参 见 问题 4.8、4.11 和 7.25。 

pcc【 名 】Steve Johnson 的 可 移植 C 编 译 器 ， 大 约 在 1978 年 最 先 为 PDP-11 所 写 
(作为 Dennis Ritchie 的 cc 的 奉 代 品 ) 。 在 UNIX 32V 和 BSD 项 目 中 移植 到 了 VAX 
后 ，pcc 得 到 了 非常 广泛 的 流传 ， 而 且 成 了 大 量 C 编 译 器 的 基础 。 跟 K&R1 一 样 ， 
它 多 年 来 一 直 都 是 C 语 言 的 事实 定义 ， 直 至 X3J11 才 开始 工作 。 注意 问题 18.3 中 
提 到 的 PCC 可 能 没什么 关系 。) 

RER (precedence) 【名 】 表 明 操 作 符 在 解析 过 程 中 和 它 的 操作 数 结合 的 
紧密 程度 的 “力量 ”， 尤 其 是 跟 相 邻 的 操作 符 比 较 而 言 。 优 先 级 跟 结 合 性 和 显 式 的 
括号 一 起 决定 表达 式 如 何 被 解析 : 哪些 操作 符 应 用 于 哪些 操作 数 ， 哪 些 子 表达 式 
是 哪些 操作 符 的 操作 数 。 优 先 级 不 一 定 表 明 任 何 求 值 顺序 。 参 见 问题 3.5。 

预 处 理 器 (preprocessor) 【名 】 编 译 右 的 一 部 分 ， 处 理 #include、#define、 
##fdef 及 相关 指令 并 在 程序 源 文件 中 进行 宏 蔡 换 。〔 传 统 上 是 一 个 独立 程序 ， 这 也 
是 它 的 名 称 的 由 来 。) 

Het FSC (pointer context) 【名 】 可 以 发 现 需 要 指针 值 的 表达 式 上 下 文 。 
C 语 言 的 指针 上 下 文 包括 : 

目标 (赋值 操作 符 左 侧 〉 为 指针 类 型 的 赋值 上 下 文 ; 

一 侧 为 指针 类 型 的 == 或 != 比 较 ; 

?: 操 作 符 的 第 二 和 第 三 个 操作 数 ， 其 中 一 个 为 指针 类 型 ; 

指针 类 型 转换 的 操作 数 ， 如 (char *) 或 (void *)。 

参见 问题 5.2。 

pun【 动 】 讲 一 个 对 象 当成 另 一 种 类 型 ， 通 常 通过 使 用 联合 或 形 如 *(othertype 
*) & object hI KIAI. 

不 规则 数组 (ragged array) 【名 】 通 常用 指针 模拟 的 数组 ， 其 中 的 行 不 一 定 


等 长 。 参 见 内 情 向 量 。 参 见 问题 6.17 和 20.2。 

可 再 入 的 Creentrant) 【 形 】 指 可 以 安全 地 被 中 断 调 用 或 在 该 代码 的 另 一 个 
实例 可 能 同时 处 于 活动 状态 时 能 被 安全 调用 的 代码 。 可 再 入 代码 在 操作 数据 的 时 
候 必 须 非 常 小 心 : 所 有 的 数据 要 么 都 是 局 部 数据 ， 要 么 由 信号 量 或 类 似 的 机 制 保 
护 。 

REFC【 名】 因特网 “请 求 注 解 ”(Reques for Comments) 文档 ， 可 以 通过 匿名 
ftp 从 ds.internic.net 和 很 多 其 他 网 站 下 载 。 

rhs【 名 】 通 常 指 赋值 操作 的 右手 边 ， 一 般 指 任何 二 元 操作 符 的 右手 边 。 

Ae Crvalue) 【名 】 原 指 可 以 出 现在 赋值 操作 符 右 侧 的 表达 式 。 一 般 指 可 
以 出 现在 表达 式 或 能 被 赋 给 其 他 变量 的 任何 值 。 在 赋值 a=b; 中 ，b 是 右 值 并 取 到 了 
它 的 值 。 与 左 值 比 较 。 参 见 [35,Sec.3.2.2.1 (特别 是 脚注 31〉] 或 [8,Sec.6.2.2.1]。 参 
见 问 题 3.18 和 4.5。 

作用 域 (scope) 【名 】 声 明 有 效 的 区 域 。【 形 】“ 在 作用 域内 ”(in 
scope) : 可 见 。 参 见 问题 1.30。 

语义 (semantics) 【名 】 程 序 的 含义 : 编译 器 (或 其 他 解释 器 〉 在 各 种 源码 
结构 上 进行 的 解释 。 与 语法 比较 。 

短路 (short circuit) 【 动 】 当 结果 可 以 确定 时 提前 结束 表达 式 的 求 值 。C 语 
言 中 的 短路 操作 符 有 区 区 、|| 和 ?:。 对 于 区 区 和 |， 如 果 第 一 个 操作 数 可 以 决定 结 
果 〈 对 于 & 区 为 零 ， 对 于 | 为 非 零 ) 则 第 二 个 操作 数 不 会 被 求 值 。 对 于 ?:， 根 据 第 
一 操作 数 的 值 ， 只 有 第 二 个 或 第 三 个 操作 数 之 一 会 被 求 值 。 参 见 问题 3.7。 

副作用 (side effect) 【名 】 当 表达 式 或 子 表达 式 被 求 值 时 除了 生成 一 个 值 以 
外 而 总 是 发 生 的 事 。 典 型 的 副作用 有 : 修改 变量 、 打 印 输出 。 参 见 [35,Sec.2.1.2.3] 
或 [8,Sec.5.1.2.3]。 

符号 保护 (sign preserving) 【 形 】 无 符号 保护 规则 的 另 一 种 称呼 。 

源 文件 (source file) 【名 】1. 包 含 C 源 码 的 任何 文件 。2. 有 具体 指 文 件 名 以 .c 结 
束 、 包 含 函数 体 和 全 局 变量 定义 (及 可 能 的 其 他 类 型 声明 和 定义 〉 的 文件 。 与 头 
文件 、 翻 译 单位 比较 。 参 见 问 题 1.7 和 10.6。 

静态 (static) 【 形 】1. (通常 称 为 “静态 生存 期 *») 指 在 程序 开始 时 一 次 分 配 
和 初始 化 之 后 在 程序 生命 周期 中 持续 存在 的 对 象 。 与 自动 比较 。 参 见 问题 1.31。 
2. 源 文件 局 部 的 ， 即 不 属于 全 局 作用 域 的 。 


严格 符合 标准 的 (strictly conforming) 【 形 】 指 仅 使 用 ANSIUISO C 中 的 功能 
而 不 依赖 任何 不 确定 、 未 定义 或 实现 定义 的 行为 的 程序 。 

字符 串 〈string) 【名 】char 型 的 数组 或 包含 以 \0' 结 束 的 字符 序列 的 内 存 块 。 

字符 串 化 (stringize) 【 动 】 将 源 符号 转换 为 字符 串 字 面 量 。 参 见 问 题 11.19 
和 11.20。 

字符 串 字 耐量 (string literal) 【名 】 源 码 中 双 引 号 之 间 的 字符 序列 。 用 于 初 
始 化 char 型 数组 或 请 求 包含 常量 字符 串 的 匿名 数组 。〔 该 字符 串通 常用 匿名 数组 
退化 成 的 指针 访问 。) 参见 1.34。 

语法 (syntax) 【名 】 程 序 的 文本 : 用 以 表达 程序 的 符号 序列 。 与 语义 比 
较 。 

标签 (tag) 特定 结构 、 联 合 或 枚 举 的 〈 可 选 ) 名 称 。 参 见 问题 2.1。 

符号 Ctoken) 【名 】1. 编 译 器 或 其 他 解释 器 可 见 的 最 小 语法 单位 ， 关键 字 、 
标识 符 、 二 元 操作 符 〈 包 括 多 字符 的 操作 符 ， 如 += 和 &&) 等 。2. 字 符 串 中 空白 
分 隔 的 词 (参见 问题 13.6) 。 

翻译 单元 (translation unit) 【名 】 编 译 器 可 见 并 作为 一 个 单元 翻译 的 源 文件 
集合 : 通常 是 一 个 .c 文 件 ( 即 源 文件 意义 2〉 加 上 ##include 指 令 包 含 的 所 有 头 文 
件 。 

未 定义 的 (undefined) 【 形 】 指 标准 中 未 规定 的 行为 ， 不 要 未 实现 对 此 做 任 
何 合理 的 动作 。 例 如 : 表达 式 i=i++ 的 行为 。 参 见 问题 3.3 和 11.35。 

终端 驱动 (terminal driver) 【和 名】 负责 基于 字符 的 (通常 交互 式 的 ) 输入 和 
输出 的 部 分 系统 软件 。 最 初 连接 的 串 行 终端 进行 输入 和 输出 ， 现 在 可 以 更 普遍 地 
与 任何 虚拟 终端 如 窗口 或 网 络 登 录 会 话 连接 。 参 见 问题 19.1。 

文本 Ctext) 【 形 】 指 用 于 处 理 可 识别 文本 的 文件 或 IO 模式 。 特 指 按 行 排列 
的 可 打印 字符 。 与 二 进 制 的 意义 3 比较 。 参 见 问题 12.43。 

解释 器 Ctranslator) 【名 】 按 C 的 语法 解析 和 解释 语义 的 程序 〈 编 译 器 、 解 释 
器 、lint 等 ) 。 

一 元 的 (unary) 【 形 】 指 带 一 个 操作 数 的 操作 符 。 与 二 元 的 比较 。 

解 循环 Cunroll) 【 动 】 重 复 循环 体 一 次 或 多 次 《同时 相应 地 缩小 循环 的 次 
数 ) 减 小 循环 控制 的 代价 (但 增加 了 代码 大 小 ) 来 提高 效率 。 

无 符号 保护 (unsigned preserving) 【 形 】 通 常 指 ANSI 前 的 实现 中 的 一 系列 的 


规则 ， 用 于 提升 二 元 操作 符 两 侧 的 有 符号 和 无 符号 类 型 ， 也 用 于 较 罕 的 无 符号 类 
型 的 一 般 性 提升 。 在 无 符号 保护 规则 下 ， 总 是 提升 到 无 符号 类 型 。 与 值 保护 比 
较 。 参 见 问 题 3.21。 

不 确定 的 Cunspecified) 【 形 】 指 标准 没有 完全 规定 的 行为 ， 每 个 实现 必须 
对 其 选择 某 种 行为 ， 但 可 以 不 提供 文档 ， 甚 至 不 必 一 致 。 例 如 : 函数 参数 和 其 他 
子 表达 式 的 求 值 顺序 。 参 见 问题 11.35。 

值 保护 (value preserving) 【 形 】 指 ANSI C 标 准 及 某 些 ANSI 前 的 实现 要 求 的 
一 系列 规则 ， 用 于 提升 三 元 操作 符 两 侧 的 有 符号 和 无 符号 类 型 ， 也 用 于 较 窜 的 无 
符号 类 型 的 一 般 性 提升 。 在 值 保护 规则 下 ， 如 果 有 符号 类 型 大 得 可 以 容纳 所 有 的 
值 则 提升 为 有 符号 类 型 ， 否 则 扩展 为 无 符号 类 型 。 与 无 符号 保护 比较 。 参 见 问 题 
全 

变 参 的 〈varargs) 【 形 】 指 接受 可 变 个 数 参 数 的 函数 ， 如 printf。 (为 变 参 的 
(variadic) 同义词 。) 2. 指 可 变 参数 列表 中 的 可 变 部 分 的 参数 之 一 。 

变 参 的 (variadic) 【 形 】 指 接受 可 变 个 数 参数 的 函数 ， 如 printf。 (为 变 参 的 
(varargs) 意义 1 的 同义词 。) 

封装 (wrapper) 【名 】 封 装 在 另 一 个 函数 〈 或 宏 ) 之 上 、 提 供 一 点 附加 功能 
的 函数 (或 宏 ) 。 例 如 malloc 的 封装 函数 可 能 会 检查 malloc 的 返回 值 。 

X3.159【 名 】 原 来 的 ANSI C 标 准 ，ANSIX3.159-1989。 参 见 问题 11.1。 

X3J11【 名 】ANSI 任 命 的 起 草 C 标 准 的 委员 会 。X3J11 现 在 作为 ISO 标准 化 工 
作 小 组 WG14 的 美国 咨询 小 组 运作 。 


[11.fluff 除 “错误 ”之 意外 ， 还 有 “绒毛 ”的 意思 ， 与 lint 同 义 。 一 一 编者 注 
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